42digest首页
使用切片Wasserstein k-means聚类在多维时间序列数据中的自动机制检测

Automated regime detection in multidimensional time series data using sliced Wasserstein k-means clustering

Qinmeng Luan and James Hamp

arXiv
2023年10月2日

最近的工作提出了Wasserstein k-means(Wk-means)聚类作为识别时间序列数据中机制的强大方法,特别是一维资产回报。 在本文中,我们首先详细研究了应用于合成一维时间序列数据的Wasserstein k-means聚类算法的行为。 我们研究算法的动力学,并研究不同的超参数如何影响不同随机初始化的聚类算法的性能。 我们计算简单的指标,我们发现这些指标在识别高质量聚类方面很有用。 然后,我们将Wasserstein k-means聚类的技术扩展到多维时间序列数据,将多维Wasserstein距离近似为切片Wasserstein距离,从而产生一种我们称之为“切片Wasserstein k-means(sWk-means)聚类”的方法。 我们将 sWk-means 聚类方法应用于多维时间序列数据中的自动化机制检测问题,使用合成数据来证明该方法的有效性。 最后,我们表明,sWk-means方法在真实多维金融时间序列中识别不同的市场制度方面是有效的,使用公开可用的外汇点汇率数据作为案例研究。 最后,我们谈到我们的方法和潜在的补充或替代方法的一些局限性。

Recent work has proposed Wasserstein k-means (Wk-means) clustering as a powerful method to identify regimes in time series data, and one-dimensional asset returns in particular. In this paper, we begin by studying in detail the behaviour of the Wasserstein k-means clustering algorithm applied to synthetic one-dimensional time series data. We study the dynamics of the algorithm and investigate how varying different hyperparameters impacts the performance of the clustering algorithm for different ...