活水快报 - 42Digest

使用马尔可夫链蒙特卡洛进行成本初始化的自我监督扩散模型微调

Self-supervised diffusion model fine-tuning for costate initialization using Markov chain Monte Carlo

Jannik Graebner, Ryne Beeson

arXiv

2025年10月2日

在全球范围内搜索和优化具有间接方法的长期低推力航天器轨迹具有挑战性,因为复杂的解决方案空间以及对成本变量产生良好的初始猜测的困难。在多体环境中尤其如此。鉴于数据揭示了部分帕累托最佳前部,最好找到一种灵活的方式,其中帕累托前部可以完成,并找到相关轨迹问题的正面。在这项工作中,我们使用条件扩散模型来表示候选最优轨迹解决方案的分布。然后,我们将使用马尔可夫链蒙特卡洛算法与自我监督的微调的新方法引入到这个框架中,以实现上述目标。具体来说,使用随机行走Metropolis算法来提出新的数据,这些数据可用于使用基于对违反约束行为的有效评估和任务目标功能的奖励加权训练来微调扩散模型。该框架消除了对单独集中且经常繁琐的数据生成阶段的需求。针对两个问题提出了数值实验,证明了提高样品质量的能力,并根据马尔可夫链的理论明确靶向帕累托最优性。第一个问题适用于木星 - 欧罗巴圆形限制三体问题的转移,其中MCMC方法完成了部分帕累托前部。第二个问题演示了如何通过MCMCM自监督微调方法生成密集和优越的帕累托前部,从木星 - 欧罗巴病例开始与单独的专用全球搜索相比,土星 - 泰坦转移。

Global search and optimization of long-duration, low-thrust spacecraft trajectories with the indirect method is challenging due to a complex solution space and the difficulty of generating good initial guesses for the costate variables. This is particularly true in multibody environments. Given data that reveals a partial Pareto optimal front, it is desirable to find a flexible manner in which the Pareto front can be completed and fronts for related trajectory problems can be found. In this work...

View Source