大厂竞逐AI大模型 虚火过旺还是星辰大海?

  你方唱罢我登场。

  过去一周,国产AI大模型赛道热闹非凡。先是阿里巴巴旗下超大规模语言模型“通义千问”开放内测,后有商汤科技、昆仑万维放出自家打造的大模型成果。与此同时,科大讯飞、腾讯、360、字节跳动等也在“摩拳擦掌”,纷纷将发展人工智能列为未来企业的核心战略……

  国内科技企业围绕AI大模型上演“百团大战”背后,谁能凭硬实力拔得头筹?这一新兴技术,究竟是虚火过旺还是星辰大海?

  国产大模型“百舸争流”

  AI大模型,指的是拥有数百万以上参数规模的深度神经网络模型。这类模型在经过专门的训练后,即可对海量数据进行复杂处理和任务处理。由海外科技公司OpenAI开发的ChatGPT之所以拥有强大的对话交互能力,背靠的正是名为“GPT”的AI预训练模型。

  今年以来,随着ChatGPT爆红“出圈”,“大模型热潮”也从国外涌向了国内。

  4月7日,阿里巴巴正式发布超大规模语言模型“通义千问”,并定向邀请用户测试体验。与百度于3月中旬上线的“文心一言”大模型工具类似,“通义千问”也具备与用户进行多轮对话的能力,并支持代码编程、文案创作等功能。

  虽然没赶上国内大模型产品的“首发”,但是“通义千问”却可能是最早通过各个场景应用融入人们生活的一个。据阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇透露,钉钉、天猫精灵将于不久后正式接入该模型,未来阿里巴巴全系产品都将用上。

  4月9日,360宣布,将基于360GPT大模型开发人工智能产品矩阵“360智脑”,未来将其率先落地在“360搜索”场景,后续面向电商、营销、办公等场景深度落地。

  4月10日,商汤科技公布“日日新SenseNova”大模型体系雏形,并现场演示了该模型体系下“商量SenseChat”语言工具的超长文本阅读理解、健康咨询等创新能力。同日,游戏起家的昆仑万维也对外预告,不日将发布和奇点智源合作自研的大模型成果——“天工”3.5,并宣称这是“中国第一个真正实现智能涌现的国产大语言模型”。

  京东、科大讯飞、腾讯、字节跳动打造的大模型产品也有望在未来一个月集中亮相。

  除此之外,由美团联合创始人王慧文、创新工场创始人李开复、搜狗创始人王小川等企业高管领衔的“AI大模型创业军团”,也对AI大模型风口“虎视眈眈”。

  “当前AI大模型仍是新兴技术,未来的竞争格局在一定程度上取决于各厂商的举措、战略方向与资本投资方向。”IDC中国助理研究总监卢言霞指出,目前AI大模型处于百花齐放的状态,未来企业要想真正跑赢对手,不能仅靠“一头热”,而是需要培养自身在数据、场景、软硬一体算力等方面的多重能力。

(责任编辑:AK007)