今年以来,人工智能引发持续关注。在近日举行的2023年亚布力中国企业家论坛第十九届夏季高峰会上,与会嘉宾热议人工智能大模型。
机器深度学习的革命
GPT是一种先进的自然语言处理模型,通过预训练可以适应各种任务,以实现更高的语言理解和生成能力。360集团创始人周鸿祎表示,OpenAI最大的创新是首次突破局限性,可以用人类所有的知识训练大模型。
“机器深度学习的革命大致经历了三波,一浪比一浪大。”地平线创始人、CEO余凯回顾说,第一波在2010年左右,语音识别取得突破,用深度学习取代了马尔可夫模型,取得了前所未有的效果;第二波是2012年卷积神经网络在图像识别方面取得突破性进展,超出了人们的想象;最近的第三波是ChatGPT,它搭载的语言模型,接近甚至超过人类水平,颠覆了过去四五十年计算语言学、自然语言处理的研究,是革命性的技术突破。
深圳人工智能与机器人研究院常务副院长丁宁表示,大模型的关键,是方法里有一个预训练的步骤,“以前机器学习是人类指导或机器琢磨。预训练是自己构建一种世界常识体系,基于世界运行的规则来相互关联。这种关联是通过常识构建起来的,效果超出想象”。
“大模型是一种全新的方法论,让AI拥有人类般的智慧。”深圳云天励飞技术股份有限公司创始人兼CEO陈宁介绍,大模型实际是把跨领域、多行业的人类知识体系,通过超大规模算力输入类人脑神经网络的数学模型里,通过计算范式,在很多领域拥有内容生产、逻辑推理能力。
我国仍在追赶阶段
在新一轮AI竞争中,我国能否快速跟上?余凯表示,构建一个大模型至少需要几千颗芯片,大算力需要芯片之间互联,而芯片互联需要超高速带宽。目前,我国大模型在整体综合实力和创新发展上,较头部企业仍有较大差距。
“大模型还存在应用和成本问题,当前,芯片的成本,尤其是训练和推理的成本较高。”陈宁表示。
据介绍,AI芯片可分为训练芯片和推理芯片两大类。对大模型、AI算法而言,训练不是目的,推理和应用才是最终目的。在训练芯片方面,受限于生产制造的设备、工艺,我国许多企业仍在追赶阶段。在推理领域则蕴藏着诸多机遇,由于场景碎片化,还没有任何国际标准和垄断性的企业。
周鸿祎表示,人工智能是一次工业革命,大家都很关心人工智能如何跟产业数字化相结合,实现行业化、企业化、专业化、垂直化。虽然在原始创新上需要时间追赶,但我国人口众多、企业众多、场景众多,会产生很多创新机会。