Cluster Catch Digraphs with the Nearest Neighbor Distance
Rui Shi, Elvan Ceyhan, and Nedret Billor
我们引入了一种基于 Cluster Catch Digraphs (CCD) 的聚类的新方法。 新方法通过使用采用空间随机性测试的新变体来解决RK-CCD的限制,该测试使用最近邻距离(NND)而不是RK-CCD使用的Ripley的K函数。 我们进行全面的蒙特卡洛分析,以评估我们方法的性能,考虑诸如尺寸、数据集大小、集群数量、集群数量和集群间距离等因素。 我们的方法对于高维数据集特别有效,可与依赖 KS 型统计或 Ripley 的 KS-CCD 和 RK-CCD 相媲美或优于 KS-CCD。 我们还使用真实和复杂的数据集评估我们的方法,将它们与众所周知的聚类方法进行比较。 同样,我们的方法表现出具有竞争力的性能,产生具有理想性能的高质量集群。 关键词:基于图形的聚类,聚类捕获digraphs,高维数据,最近的邻居距离,空间随机性测试
We introduce a new method for clustering based on Cluster Catch Digraphs (CCDs). The new method addresses the limitations of RK-CCDs by employing a new variant of spatial randomness test that employs the nearest neighbor distance (NND) instead of the Ripley's K function used by RK-CCDs. We conduct a comprehensive Monte Carlo analysis to assess the performance of our method, considering factors such as dimensionality, data set size, number of clusters, cluster volumes, and inter-cluster distance....