42digest首页
数据云上图拉普拉斯算子特征值的中心极限定理

Central limit theorems for the eigenvalues of graph Laplacians on data clouds

Chenghui Li, Nicolás García Trillos, Housen Li, Leo Suchan

arXiv
2025年7月24日

给定从嵌入欧几里得空间的低维流形M上支撑的分布中采样的i.i.d.样本X_n ={ x_1, …, x_n },我们考虑与X_n上ε-邻近图相关联的图拉普拉斯算子Δ_n,并研究其特征值围绕其均值的渐近波动。特别地,令λ̂_l^ε表示Δ_n的第l个特征值,在数据生成模型和ε衰减速率的适当假设下,我们证明√(n ) (λ̂_l^ε - 𝔼[λ̂_l^ε] )是渐近高斯的,其方差可以明确表征。通过形式论证,我们可以将此渐近方差解释为某种能量梯度流关于Fisher-Rao几何的耗散。这种几何解释反过来使我们能够从统计角度解释该渐近方差,即将其视为估计某些加权拉普拉斯-贝尔特拉米算子特征值的克拉美-罗下界。后一种解释表明了图拉普拉斯算子特征值的一种渐近统计效率形式。我们还提出了多重特征值的中心极限定理,并通过多个数值实验探讨了当我们理论分析中的某些假设放宽时,我们结果的有效性。

Given i.i.d. samples X_n ={ x_1, …, x_n } from a distribution supported on a low dimensional manifold M embedded in Eucliden space, we consider the graph Laplacian operator Δ_n associated to an ε-proximity graph over X_n and study the asymptotic fluctuations of its eigenvalues around their means. In particular, letting λ̂_l^ε denote the l-th eigenvalue of Δ_n, and under suitable assumptions on the data generating model and on the rate of decay of ε, we prove that √(n ) (λ̂_l^ε - 𝔼[λ̂_l^ε] ) is ...