A general framework for adaptive nonparametric dimensionality reduction
Antonio Di Noia, Federico Ravenda, Antonietta Mira
减少维度是现代数据科学的一项基本任务。 已经提出了几种专门根据通过局部嵌入考虑数据非线性的投影方法。 这种方法通常基于当地的社区结构,需要调整定义这种地方结构的邻居的数量,以及预测数据的低维空间的维度。 这种选择严重影响了由此产生的嵌入的质量。 在本文中,我们利用最近提出的固有维度估算器,该估算器还根据一些理想的标准返回最佳的本地适应性社区尺寸。 原则上,可以使用这个自适应框架来对依赖于本地邻居结构的任何尺寸减小算法进行最佳的超参数调整。 现实世界和模拟数据集上的数字实验表明,当用于各种学习任务时,建议的方法可用于显着改进众所周知的投影方法,通过定量指标和低维可视化的质量来衡量改进。
Dimensionality reduction is a fundamental task in modern data science. Several projection methods specifically tailored to take into account the non-linearity of the data via local embeddings have been proposed. Such methods are often based on local neighbourhood structures and require tuning the number of neighbours that define this local structure, and the dimensionality of the lower-dimensional space onto which the data are projected. Such choices critically influence the quality of the resul...