活水快报 - 42Digest

用于3D人姿势估计的自适应图 Kolmogorov-Arnold 网络

Adaptive graph Kolmogorov-Arnold network for 3D human pose estimation

Abu Taib Mohammed Shahjahan and A. Ben Hamza

arXiv

2025年11月11日

基于图形卷积网络(GCN)的方法通过利用人类骨骼的自然图形结构,在3D人类姿势估计中显示出强劲的性能。然而,它们的局部接受场限制了他们捕获处理遮挡和深度模糊所必需的远程依赖的能力。他们还表现出光谱偏差,它优先考虑低频组件,同时努力对高频细节进行建模。在本文中,我们介绍了PoseKAN,一个自适应图Kolmogorov-Arnold网络(KAN),该框架将KAN扩展到基于图形的学习,用于2D到3D的从单个图像中提升。与使用固定激活函数的GCN不同,KAN在图形边缘使用可学习函数,允许数据驱动的自适应特征转换。这增强了模型的适应性和表现力,使其在学习复杂的姿势变化时更具表现力。我们的模型采用多跳功能聚合,确保身体关节能够利用来自本地和远处邻居的信息,从而提高空间意识。它还集成了剩余的PoseKAN块,以实现更深入的功能改进,以及改进特征选择性和对比度的全局响应规范化。基准数据集上的大量实验证明了我们的模型与最先进的方法的竞争表现。

Graph convolutional network (GCN)-based methods have shown strong performance in 3D human pose estimation by leveraging the natural graph structure of the human skeleton. However, their local receptive field limits their ability to capture long-range dependencies essential for handling occlusions and depth ambiguities. They also exhibit spectral bias, which prioritizes low-frequency components while struggling to model high-frequency details. In this paper, we introduce PoseKAN, an adaptive grap...

计算机视觉与模式识别

View Source