42digest首页
数据集的键入拓扑结构

Typed Topological Structures Of Datasets

Wanjun Hu

arXiv
2025年8月19日

R^2 上的数据集 X 是一个有限的拓扑空间。 目前对数据集的研究侧重于统计方法和代数拓扑方法<cit.>。 在<cit.>中,引入了类型拓扑空间的概念,并显示出研究有限拓扑空间(如数据集)的潜力。 从一般拓扑的角度来看,这是一种新方法。 类型的拓扑空间是一个拓扑空间,其开放的集合被分配类型。 拓扑概念和方法可以使用某些类型的开放集合重新定义。 在本文中,我们在数据集X上开发了一组特殊的类型及其相关类型拓扑。 使用它,我们可以研究X的内部结构。 特别是,R^2有一个自然的范围空间,其中X被组织成轨道,每个轨道被分成组件。 这些组件是在一个订单。 此外,它们可以用整数序列表示。 穿过轨道的组件形成分支,这种关系可以用一种伪树(称为 typed-II 伪树)很好地表示。 这种结构为计算凸壳体、孔、聚类和异常检测等问题提供了新的算法平台。

A datatset X on R^2 is a finite topological space. Current research of a dataset focuses on statistical methods and the algebraic topological method <cit.>. In <cit.>, the concept of typed topological space was introduced and showed to have the potential for studying finite topological spaces, such as a dataset. It is a new method from the general topology perspective. A typed topological space is a topological space whose open sets are assigned types. Topological concepts and methods can be red...