A Review of Tools and Techniques for Optimization of Workload Mapping and Scheduling in Heterogeneous HPC System
Aasish Kumar Sharma and Julian Kunkel
本文对高性能计算(HPC)计算连续体中的映射和调度策略进行了系统审查,特别强调了异构系统。 它引入了一个原型工作流程,以建立工作负载表征和资源分配的基础概念。 在此基础上,对66篇选定的研究论文进行了彻底分析 - 从2017年到2024年 - 评估了用于工作负载映射和调度的当代工具和技术。 审查强调,传统的Job Shop调度配方往往缺乏有效模拟现代HPC数据中心复杂性所需的表现力。 它还重申将HPC调度问题归类为NP-hard,因为它们的组合性质以及系统和工作量限制的多样性。 该分析揭示了对启发式和元启发式策略的普遍依赖,包括自然启发,进化,排序和搜索算法。 为了弥补观察到的差距,该研究倡导混合优化方法,战略性地整合启发式,元启发式,机器学习和新兴的量子计算技术。 当针对特定问题域进行定制时,这种集成有望显著提高异构 HPC 环境中工作负载优化的可扩展性、效率和适应性。
This paper presents a systematic review of mapping and scheduling strategies within the High-Performance Computing (HPC) compute continuum, with a particular emphasis on heterogeneous systems. It introduces a prototype workflow to establish foundational concepts in workload characterization and resource allocation. Building on this, a thorough analysis of 66 selected research papers - spanning the period from 2017 to 2024 - is conducted, evaluating contemporary tools and techniques used for work...