发表时间:2024-03-27
人工智能无疑是当前最热门的话题之一,人们同样期待它在环境和气候变化领域发挥作用。据研究,人工智能有望在能源优化、智能交通系统、精准农业、气候模型等方面帮助减少碳排放。然而我们也需要注意,AI系统的训练和运行需要大量的计算能力和电力,这可能导致更多的碳排放。
人工智能(AI)符号显示在智能手机上
《自然》网站于2月20日刊登了南加州大学安纳伯格分校教授、纽约微软研究院高级首席研究员Kate Crawford的评论文章《生成式人工智能的环境成本正在飙升——而且大多是秘密的》。文章开篇引用了OpenAI首席执行官Sam Altman在瑞士达沃斯举行的世界经济论坛年会上的话——Altman警告说,下一波生成式人工智能系统的耗电量将大大超出预期,能源系统将难以应对。他说:“如果没有突破,就不可能实现目标。”
Crawford写道:“我很高兴他这么说。自从我在2018年开始发表有关人工智能产业环境成本的文章以来,我看到了对人工智能产业环境成本的一贯淡化和否认。Altman的承认让研究人员、监管机构和行业巨头开始谈论生成式人工智能对环境的影响。”
Altman寄希望于什么能源突破呢?不是设计和部署更可持续的人工智能系统,而是核聚变。2021年,他开始投资位于华盛顿州埃弗雷特的核聚变公司Helion Energy。
文章列举了一些数据和例子来说明生成式人工智能的环境成本:
近年来,人工智能模型变得越来越大,研究人员现在用数千亿个参数来测量它们的大小。“参数”是模型中使用的内部连接,用于基于训练数据学习模式。对于像ChatGPT这样大型语言模型,使用Google的PalM模型,已经从2018年的1亿个参数增加到2023年的5千亿个参数。这种增长背后的理论是,参数更多的模型应该有更好的表现,即使是在最初没有接受过训练的任务上,尽管这一假设仍未得到证实。
多年来模型规模的增长
Helion公司最乐观的估计是,到2029年,它生产的能源足以为4万户美国普通家庭提供电力;而一项评估表明,OpenAI公司开发的ChatGPT已经消耗了3.3万户家庭的能源。据估计,由生成式人工智能驱动的搜索所消耗的能源是传统网络搜索的四到五倍。数年内,大型人工智能系统所需的能源可能与整个国家相当。
这不仅仅是能源问题。生成式人工智能系统需要大量淡水来冷却处理器和发电。在爱荷华州的西得梅因,一个巨大的数据中心集群为OpenAI最先进的模型GPT-4服务。当地居民提起的诉讼显示,2022年7月,也就是OpenAI完成模型训练的前一个月,该集群使用了该地区约6%的水。根据谷歌和微软的环境报告,在谷歌和微软准备Bard和Bing大型语言模型的过程中,两家公司的用水量都出现了大幅飙升——一年内分别增加了20%和34%。一份预印本论文显示,到2027年,全球人工智能的用水需求可能相当于英国的一半。
Crawford认为,与其寄希望于白日梦般的核聚变技术的突破,生成式人工智能行业不如优先考虑使用更少的能源,建立更高效的模型,并重新思考如何设计和使用数据中心。正如法国BigScience项目通过其BLOOM模型所展示的那样,建立一个与OpenAI的GPT-3规模相似、碳足迹却低得多的模型是可能的。
但这并不是整个行业的现状。要获得准确、完整的环境影响数据仍然非常困难。生成式人工智能的全部地球成本是企业严守的秘密。Crawford写道:“相关数据依赖于Emma Strubell和Sasha Luccioni等研究人员的实验室研究、有限的公司报告以及地方政府公布的数据。目前,企业几乎没有改变的动力。”
今年2月初,西雅图艾伦人工智能研究所(Allen Institute for AI,简称AI2)与贝索斯地球基金(Bezos Earth Fund)在国会山合作举办了一场以人工智能与气候为主题的活动。其中,透明度是讨论的一个关键主题,尤其是整个机器学习领域缺乏透明度和需要透明度的问题。AI2气候建模团队高级研究工程师Andre Perkins说:“我们现在不知道这些模型的大部分事情……它们的关键是什么,它们是如何做出预测的。虽然这种程度的可解释性可能无法实现,但合理的信息披露,如模型是如何训练的、使用了多少功率等,都是非常有用的——但目前并没有分享这些信息的要求或激励措施。”
麻省理工学院助理教授、气候变化人工智能联合创始人兼主席Priya Donti告诫说:“依靠核聚变解决方案作为应对能源和人工智能使用增长的唯一解决方案,可能会被视为一种转移注意力的策略,以避免思考真正的问题。”
AI2的高级研究科学家兼绿色人工智能作者Jesse Dodge认为,认识到一些大型人工智能系统的二氧化碳排放量尤为重要,不过一般来说,人工智能系统的影响将来自它们的应用,而不一定是训练成本。
Crawford认为,要真正解决人工智能对环境的影响,需要包括人工智能行业、研究人员和立法者在内的多方面共同努力。她提出了一些具体的建议:
在行业中,可持续的做法应势在必行,应包括测量和公开报告能源和水的使用情况;优先发展节能硬件、算法和数据中心;以及只使用可再生能源。独立机构的定期环境审计将有助于提高透明度和遵守标准。研究人员可以优化神经网络架构以实现可持续性,并与社会和环境科学家合作,引导技术设计实现更高的生态可持续性。最后,立法者应同时提供胡萝卜和大棒。从一开始,他们就可以设定能源和水的使用基准,鼓励采用可再生能源,并强制要求进行全面的环境报告和影响评估。
生成性人工智能有许多隐性成本
今年2月1日,以马萨诸塞州参议员Ed Markey为首的美国民主党人提出了《2024 年人工智能环境影响法案》(Artificial Intelligence Environmental Impacts Act of 2024)。该法案要求美国国家标准与技术研究院与学术界、工业界和民间社会合作,建立人工智能环境影响评估标准,并为人工智能开发商和运营商建立自愿报告框架。立法能否通过仍是未知数。
Kate Crawford曾于2021年出版《Atlas of AI》一书,这本书主要关注人工智能的伦理问题。在书中,Crawford关注了在未经同意的情况下建立数据集的做法,以及在错误或有偏见的数据上进行训练的做法,特别关注了ImageNet和亚马逊对工作申请者进行分类的失败项目。她批评了人们通常将AlphaGo视为超凡的智能,而不是大量暴力计算的自然产物,以及对环境成本的忽视。她还讨论了科技亿万富翁们开发私人太空飞行以逃避地球资源枯竭的幻想。这本书得到了评论家的好评,他们特别赞扬了书中对劳动和环境的剥削、算法偏见等问题的探讨。
本文转自澎湃新闻
部分图片来源于网络,版权归原作者所有,如有异议可联系删除。