From Best Responses to Learning: Investment Efficiency in Dynamic Environment
Ce Li, Qianfan Zhang, Weiqiang Zheng
我们研究一种机制在动态环境中的福利,学习型投资者可以进行昂贵的投资来改变她的价值。 在许多现实问题中,投资者总是做出最佳反应的共同假设,即选择她的效用最大化投资选择,由于动态环境中信息不完整,是不现实的。 为了解决这个问题,我们考虑使用无遗憾在线学习算法的投资者,通过与环境的反复互动来适应性地选择投资。 我们分析近似分配算法的福利保证如何在投资者学习而不是最佳响应时从静态设置扩展到动态设置,通过研究最佳福利的近似比作为算法在动态学习环境中不同基准的性能的测量。 首先,我们表明静态环境中的近似比在动态环境中相对于最佳后见之基准保持不变。 其次,我们提供相对于更强的时间变化基准的近似上下边界的紧密表征。 结合在线学习理论的桥接机制设计,我们的工作展示了即使代理人无法做出最佳反应,但在复杂,不确定的环境中学习他们的投资策略,也可以保持强有力的福利保障。
We study the welfare of a mechanism in a dynamic environment where a learning investor can make a costly investment to change her value. In many real-world problems, the common assumption that the investor always makes the best responses, i.e., choosing her utility-maximizing investment option, is unrealistic due to incomplete information in a dynamically evolving environment. To address this, we consider an investor who uses a no-regret online learning algorithm to adaptively select investments...