Uncertainty Guided Online Ensemble for Non-stationary Data Streams in Fusion Science
Kishansingh Rajput, Malachi Schram, Brian Sammuli, Sen Lin
机器学习(ML)有望在下一代融合设备的开发和运行中发挥关键作用。 融合数据显示了分布漂移的非静止行为,这是由实验进化和机器磨损引起的。 ML模型假设固定分布,并且在遇到此类非静态数据流时无法保持性能。 在线学习技术已经在其他领域被利用,但它在很大程度上尚未探索用于融合应用。 在本文中,我们介绍了在线学习的应用,以持续适应漂移数据流,以预测DIII-D融合设施的Toroidal Field(TF)线圈偏转。 结果表明,与静态模型相比,在线学习对于保持ML模型性能至关重要,并将误差减少了80%。 此外,传统的在线学习可能会受到短期性能下降的影响,因为预测之前无法获得地面真相。 因此,我们提出了一个不确定性引导的在线集成方法,以进一步提高性能。 深度高斯过程近似(DGPA)技术用于校准不确定性估计,然后使用不确定性值来指导元算法,该算法基于在不同历史数据视界训练的学习者集合产生预测。 DGPA还为决策者提供了不确定性估计以及预测。 在线集成和拟议的不确定性引导在线集成将预测误差分别比基于标准的在线学习减少了约6%和10%。
Machine Learning (ML) is poised to play a pivotal role in the development and operation of next-generation fusion devices. Fusion data shows non-stationary behavior with distribution drifts, resulted by both experimental evolution and machine wear-and-tear. ML models assume stationary distribution and fail to maintain performance when encountered with such non-stationary data streams. Online learning techniques have been leveraged in other domains, however it has been largely unexplored for fusi...