Multi-Agent Reinforcement Learning for Greenhouse Gas Offset Credit Markets
Liam Welsh, Udit Grover, Sebastian Jaimungal
气候变化是对人类未来的主要威胁,其影响正在因人为温室气体排放过剩而加剧。 政府可以用来控制这些排放的一个方法是向企业提供排放限制,并惩罚任何超过极限的超额排放。 过度排放也可能被选择投资于碳减排和捕获项目的公司所抵消。 这些项目产生抵消信贷,可以提交给监管机构,以抵消公司的超额排放,或者他们可以与其他公司进行交易。 在这项工作中,我们描述了抵消信贷市场的有限代理纳什均衡。 由于计算纳什均衡是一个NP难题,我们利用现代强化学习技术纳什-DQN来有效地估计市场的纳什均衡。 这不仅证明了在气候主题金融市场中使用强化学习方法的有效性,而且还证明了排放公司在通过数值实验遵守纳什均衡时可能实现的重大财务节约。
Climate change is a major threat to the future of humanity, and its impacts are being intensified by excess man-made greenhouse gas emissions. One method governments can employ to control these emissions is to provide firms with emission limits and penalize any excess emissions above the limit. Excess emissions may also be offset by firms who choose to invest in carbon reducing and capturing projects. These projects generate offset credits which can be submitted to a regulating agency to offset ...