On the flow matching interpretability
Francesco Pivi, Simone Gazza, Davide Evangelista, Roberto Amadini, Maurizio Gabbrielli
基于流量匹配的生成模型在各个领域都取得了显着的成功,但它们受到一个基本限制:在其中间生成步骤中缺乏可解释性。 事实上,这些模型通过一系列矢量字段更新学习将噪声转化为数据,但每个步骤的含义仍然不透明。 我们通过提出一个通用框架来解决这个问题,该框架将每个流程步骤从已知的物理分布中采样。 流量轨迹被映射到(并限制穿越)模拟物理过程的平衡状态。 我们通过2D Ising模型实现这种方法,使流动步骤成为沿着参数冷却时间表的热平衡点。 我们提出的架构包括一个编码器,将离散的 Ising 配置映射到连续的潜在空间,一个执行温度驱动扩散的流匹配网络,以及一个返回离散 Ising 状态的投影仪,同时保留物理约束。 我们在多个格子尺寸上验证此框架,表明它保留了物理保真度,同时随着晶格尺寸的增加,它在速度上优于蒙特卡洛一代。 与标准流量匹配相反,每个矢量字段在2D Ising模型的潜在空间中代表了一个有意义的逐步过渡。 这表明将物理语义嵌入生成流将不透明的神经轨迹转化为可解释的物理过程。
Generative models based on flow matching have demonstrated remarkable success in various domains, yet they suffer from a fundamental limitation: the lack of interpretability in their intermediate generation steps. In fact these models learn to transform noise into data through a series of vector field updates, however the meaning of each step remains opaque. We address this problem by proposing a general framework constraining each flow step to be sampled from a known physical distribution. Flow...