42digest首页
FractalCloud:用于高效大规模点云处理的分形启发式架构

FractalCloud: A Fractal-Inspired Architecture for Efficient Large-Scale Point Cloud Processing

Yuzhe Fu, Changchun Zhou, Hancheng Ye, Bowen Duan, Qiyu Huang, Chiyue Wei, Cong Guo, Hai "Helen" Li, and Yiran Chen

arXiv
2025年11月10日

三维(3D)点云越来越多地用于自动驾驶、机器人和虚拟现实(VR)等应用。 基于点的神经网络(PNN)在点云分析中表现出强劲的表现,最初针对的是小规模输入。 然而,随着PNN的发展,以数十万点处理大规模点云,点云处理中的所有计算和全球内存访问引入了大量的开销,导致 O(n^2) 计算复杂性和内存流量,其中n是点数。 现有的加速器主要针对小规模工作负载进行优化,由于分区和非并行架构效率低下,忽略了这一挑战,并且规模不佳。 为了解决这些问题,我们提出了 FractalCloud,一个分形启发的硬件架构,用于高效的大规模 3D 点云处理。 FractalCloud引入了两个关键优化:(1)一种共同设计的用于形状感知和硬件友好分区的分形方法,以及(2)块-并行点运算,对所有点运算进行分解和并行。 具有片上分形和灵活并行的专用硬件设计进一步在有限的内存资源内实现完全并行处理。 FractalCloud采用28nm技术作为核心面积为1.5 mm^2的芯片布局,比最先进的加速器实现了21.7倍的加速和27倍的能量降低,同时保持了网络精度,证明了其PNN推理的可扩展性和效率。

Three-dimensional (3D) point clouds are increasingly used in applications such as autonomous driving, robotics, and virtual reality (VR). Point-based neural networks (PNNs) have demonstrated strong performance in point cloud analysis, originally targeting small-scale inputs. However, as PNNs evolve to process large-scale point clouds with hundreds of thousands of points, all-to-all computation and global memory access in point cloud processing introduce substantial overhead, causing O(n^2) compu...