ChatGPT背后的肮脏秘密：被抖出来了

日期：2023-02-13 15:37 来源：互联网

北京时间2月13日消息，随着ChatGPT的爆红，微软、谷歌、百度相继宣布对他们的搜索引擎进行重大改革，试图将大型人工智能模型整合到搜索中，以便给用户提供更丰富、更准确的体验。但是兴奋之余，新工具背后可能隐藏着一个“肮脏的秘密”。

外媒指出，构建高性能人工智能搜索引擎的竞赛很可能需要计算能力的大幅提升，它所产生的后果将是科技公司所需能源和碳排放量的大幅增加。

英国萨里大学网络安全教授艾伦·伍德沃德(Alan Woodward)表示：“已经有大量资源被用于索引和搜索互联网内容，但人工智能的整合需要一种不同的火力。

它需要处理能力、存储和高效搜索。每当我们看到在线处理的步骤变化时，我们就会看到大型处理中心所需的电力和冷却资源的显著增加。我认为人工智能的整合可能是会走这一步。”

碳排放大增

训练大型语言模型(LLMs)意味着在大量数据中解析和计算链接，这就是为什么它们往往是由拥有大量资源的公司开发的原因，比如为微软必应搜索提供动力的ChatGPT，为谷歌聊天机器人“巴德”(Bard)提供支持的那些语言模型。

ChatGPT背后的肮脏秘密：被抖出来了

“训练这些模型需要大量的计算能力，”西班牙科鲁尼亚大学(University of Coruña)计算机科学家卡洛斯·戈麦兹·罗德里古兹(Carlos Gómez-Rodríguez)表示，“现在，只有大型科技公司才能训练他们。”

尽管OpenAI和谷歌都没有透露其产品的计算成本是多少，但研究人员发布的第三方分析预计，ChatGPT部分依赖的GPT-3模型的训练会消耗1287兆瓦时电力，产生550多吨的二氧化碳当量，相当于一个人在纽约和旧金山之间往返550次。

“这个数字看起来没有那么糟糕，但你必须考虑到这样一个事实：你不仅要训练它，还要执行它，为数百万用户服务。”罗德里古兹表示。

而且，把ChatGPT作为一个独立产品使用与把它整合到必应中还有很大不同。投行瑞银预计，ChatGPT日均独立访问用户为1300万。相比之下，必应每天要处理5亿次搜索。

加拿大数据中心公司QScale联合创始人马丁·布查德(Martin Bouchard)认为，根据他对微软和谷歌搜索计划的了解，在搜索过程中添加生成式人工智能，需要“每次搜索至少增加4到5倍的计算量”。

为了满足搜索引擎用户的需求，企业必须做出改变。“如果他们要经常重新训练模型，并添加更多参数之类的东西，这是一个完全不同的规模，”布查德表示，“这将需要在硬件上进行大量投资。我们现有的数据中心和基础设施将无法应对生成式人工智能的消耗。它们对性能的需求太高了。”

（责任编辑：AK007）