Multi-Fidelity Bayesian Optimization for Nash Equilibria with Black-Box Utilities
Yunchuan Zhang, Osvaldo Simeone, H. Vincent Poor
现代开放和软化系统(如O-RAN电信网络和云计算平台)托管独立开发的应用程序,具有不同的、可能相互冲突的目标。 协调此类应用程序的行为以确保稳定的系统运行带来了重大挑战,特别是当每个应用程序的实用程序只能通过昂贵的黑箱评估访问时。 在本文中,我们考虑了一个集中优化框架,其中系统控制器向代表不同应用程序的多个战略参与者建议联合配置,目标是将其激励机制调整为稳定的结果。 为了模拟这种交互,我们制定了一个Stackelberg游戏,其中中央优化器无法访问分析实用函数,而是必须通过顺序的多保真评估来学习它们。 为了应对这一挑战,我们提出了MF-UCB-PNE,这是一种新颖的多保真贝叶斯优化策略,利用预算受限的采样过程来近似纯纳什均衡(PNE)解决方案。 MF-UCB-PNE系统地平衡了低成本近似的勘探与高保真开采步骤,从而实现与激励兼容配置的高效融合。 我们为查询成本与均衡准确性之间的权衡提供了理论和实证见解,证明了MF-UCB-PNE在有限成本预算下确定有效均衡解决方案的有效性。
Modern open and softwarized systems – such as O-RAN telecom networks and cloud computing platforms – host independently developed applications with distinct, and potentially conflicting, objectives. Coordinating the behavior of such applications to ensure stable system operation poses significant challenges, especially when each application's utility is accessible only via costly, black-box evaluations. In this paper, we consider a centralized optimization framework in which a system controller ...