Is Noisy Data a Blessing in Disguise? A Distributionally Robust Optimization Perspective
Chung-Han Hsieh and Rong Gan
嘈杂的数据通常被视为决策的挑战。 本文研究了一个分布稳健的优化(DRO),展示了如何系统地将这种噪声纳入。 我们不是在嘈杂的经验分布中应用DRO,而是通过将Wasserstein球集中在观测空间中的嘈杂的经验分布中并通过已知的噪声内核获取其逆图像来构建对潜在分布的模糊设置。 我们通过推导可处理的凸重制和建立严格的统计保证(包括有限样本性能和渐近一致性)来验证这种逆图像结构。 至关重要的是,我们证明,在温和的条件下,嘈杂的数据可能是“变相的祝福”。 我们的嘈杂数据DRO模型不如其直接对应模型保守,导致可证明更高的最优值和更低的模糊性价格。 在公平的资源分配问题的背景下,我们证明这种强有力的方法可以产生结构上更公平的解决方案。 我们的研究结果表明,管理者可以利用不确定性,将噪音作为稳健性的来源,而不是将其视为障碍,从而产生更稳健和战略性平衡的决策。
Noisy data are often viewed as a challenge for decision-making. This paper studies a distributionally robust optimization (DRO) that shows how such noise can be systematically incorporated. Rather than applying DRO to the noisy empirical distribution, we construct ambiguity sets over the latent distribution by centering a Wasserstein ball at the noisy empirical distribution in the observation space and taking its inverse image through a known noise kernel. We validate this inverse-image construc...