活水快报 - 42Digest

生态友好型人工智能:为绿色联邦学习释放数据力量

Eco-Friendly AI: Unleashing Data Power for Green Federated Learning

Mattia Sabella and Monica Vitali

arXiv

2025年7月23日

人工智能(AI)和机器学习(ML)的广泛采用带来了重大的环境影响,特别是在能源消耗和碳排放方面。这个紧迫的问题突出表明需要创新的解决方案来减轻人工智能的生态足迹。影响ML模型训练能耗的关键因素之一是训练数据集的大小。 ML模型通常对分布在多个位置的传感器和设备持续生成的大量数据进行训练。为了降低数据传输成本并增强隐私,Federated Learning (FL) 无需移动或共享原始数据即可实现模型训练。虽然FL提供了这些优势,但由于数据源的异质性(与体积和质量有关)、计算节点能力和环境影响,它也带来了挑战。本文通过提出以数据为中心的绿色联邦学习方法,为绿色人工智能的进步做出了贡献。具体来说,我们专注于通过最小化训练数据的数量来减少FL对环境的影响。我们的方法涉及对联合数据集的特征进行分析,根据质量指标选择最佳数据子集,以及选择环境影响最低的联合节点。我们开发了一个综合方法,研究以数据为中心的因素(如数据质量和体积)对FL训练性能和碳排放的影响。在这些见解的基础上,我们引入了一个交互式推荐系统,通过减少数据优化FL配置,最大限度地减少训练过程中对环境的影响。将这种方法应用于时间序列分类在减少FL任务对环境的影响方面显示出有希望的结果。

The widespread adoption of Artificial Intelligence (AI) and Machine Learning (ML) comes with a significant environmental impact, particularly in terms of energy consumption and carbon emissions. This pressing issue highlights the need for innovative solutions to mitigate AI's ecological footprint. One of the key factors influencing the energy consumption of ML model training is the size of the training dataset. ML models are often trained on vast amounts of data continuously generated by sensors...

机器学习人工智能数据库分布式、并行与集群计算

View Source