Persistent Homology via Ellipsoids
Niklas Canova and Sara Kališnik and Aaron Moser and Bastian Rieck and Ana Žegarac
持续性同源学是拓扑数据分析中最流行的方法之一。 其使用的第一步是构建一个嵌套序列的简单复合物。 有很多不同的复合物可供选择,Čech,Rips,alpha和见证复合体是受欢迎的选择。 在这份手稿中,我们构建了一种新颖的几何学简单复合体,称为Rips型椭圆复合体。 这种复合体是基于这样的想法,即与切线方向对齐的椭圆与以样品点为中心的传统(欧几里得)球相比,更好地近似数据,如Rips和Alpha复合物的构造。 我们使用主成分分析直接从样本中估计切线空间,并提出了一种用于计算Rips-type椭圆条形码的算法,即基于Rips-type椭圆复合物的拓扑描述符。 此外,我们表明椭圆条形码持续依赖于输入数据,因此k-generic点云的小扰动导致由此产生的椭圆条形码按比例小的变化。 这提供了一个理论保证,类似于Rips和Čech过滤的经典稳定性结果,如果稍弱的话。 我们还进行了广泛的实验,并将Rips型椭圆条形码与标准Rips条形码进行比较。 我们的研究结果表明,Rips型椭圆复合物对于估计来自样品的瓶颈的流形和空间的同源性特别有效。 特别是,与使用Rips综合数据所获得的相比,与地面真理拓扑特征对应的持久性间隔更长。 此外,Rips型椭圆条形码在采样点云中提供更好的分类结果。 最后,我们证明Rips型椭圆条形码在分类任务中优于Rips条形码。
Persistent homology is one of the most popular methods in topological data analysis. An initial step in its use involves constructing a nested sequence of simplicial complexes. There is an abundance of different complexes to choose from, with Čech, Rips, alpha, and witness complexes being popular choices. In this manuscript, we build a novel type of geometrically informed simplicial complex, called a Rips-type ellipsoid complex. This complex is based on the idea that ellipsoids aligned with tang...