The Role of Advanced Computer Architectures in Accelerating Artificial Intelligence Workloads
Shahid Amin and Syed Pervez Hussnain Shah
人工智能(AI)的显著进步与计算机架构的并发革命有关。 随着人工智能模型,特别是深度神经网络(DNN)的复杂性,它们巨大的计算需求将传统架构推向了极限。 本文提供了这一共同进化的结构化回顾,分析了旨在加速现代人工智能工作负载的建筑景观。 我们通过分解其设计哲学、关键特性和性能权衡来探索图形处理单元(GPU)、应用特定集成电路(ASIC)和现场编程门阵列射线(FPGA)的主导架构范式。 分析和能源效率的关键原则,包括数据流优化,高级内存层次结构,陪练和量化,进行了分析。 此外,本文还展望了新兴技术,如记忆处理(PIM)和神经形态计算,这些技术可能会重新定义未来的计算。 通过将原型图原则与行业标准基准的定量性能数据进行综合,该调查全面展示了人工智能加速器景观。 我们的结论是,人工智能和计算机架构处于共生关系,其中硬件和软件共同设计不再是优化,而是未来计算进步的必要条件。
The remarkable progress in Artificial Intelligence (AI) is foundation-ally linked to a concurrent revolution in computer architecture. As AI models, particularly Deep Neural Networks (DNNs), have grown in complexity, their massive computational demands have pushed traditional architectures to their limits. This paper provides a structured review of this co-evolution, analyzing the architectural landscape designed to accelerate modern AI workloads. We explore the dominant architectural paradigms ...