“百模大战”愈演愈烈 垂直领域应用创新成破局关键

  今年以来,我国大模型产业蓬勃发展,赛道热度不断高涨。在近日举行的2023全球数字经济大会人工智能高峰论坛上,北京市经济和信息化局党组书记、局长姜广智表示,现在全国已有80余个大模型公开发布。

  大模型产业进入“百模大战”时代,各方思辨与争论不断。“‘百模大战’是否存在重复建设?”“如何推动垂直领域应用创新?”成为业界关注的焦点。

  多位接受《证券日报》记者采访的业内人士表示,大模型产业是未来科技竞争的关键较量之一。对于大多数企业而言,面向垂直场景、垂直行业、垂直领域探索基于大模型的应用创新,将是重点攻克的方向。局部的跑通,将带动行业整体景气度、创新热情和创造活力提升。

  企业争相布局

  在我国大模型产业领域,阿里、华为、腾讯等公司布局相对较早。2019年阿里进行了大模型研发,于2022年发布“通义”大模型系列。腾讯也于2022年对外披露了旗下“混元”大模型的研发进展。

  进入2023年,ChatGPT掀起了大模型浪潮。百度3月份发布大语言模型“文心一言”,成为我国首个类ChatGPT产品。之后,我国多家企业发布的大模型争相亮相。

  《证券日报》记者梳理发现,截至7月3日,我国10亿级参数规模以上大模型已超80个。除了互联网巨头外,商汤科技、云从科技、科大讯飞等人工智能赛道上市公司,光年之外、百川智能等初创企业,上海人工智能实验室、哈尔滨工业大学等科研院所单位,均先后发布了大模型。

  “我们把大模型及相关产品分为三类。第一类是通用大模型,如OpenAI的ChatGPT、百度的‘文心一言’、科大讯飞的‘星火’等都属于通用大模型;第二类是行业大模型;第三类是基于通用大模型或行业大模型的应用型服务。目前已经发布的产品大多集中在第一类和第二类。”有业内人士表示,“从参数量来看,‘文心一言’等通用大模型的参数量在1000亿级别,其他企业或初创公司大模型参数量通常在100亿、10亿级别。”

  “百模大战”是否存在重复建设?中央财经大学数字经济融合创新发展中心主任陈端在接受《证券日报》记者采访时表示:“中国在PC时代和移动互联网时代,成长起一批一度在全球领先的互联网企业,这些企业出于应对下一轮生存竞争的需要,纷纷主动加入大模型的早期研发竞争,这是一件好事。不过,通用大模型领域的竞争,未来将产生马太效应,只有少数强者能够胜出。”

  深度科技研究院院长张孝荣在接受《证券日报》记者采访时也表示:“大模型训练有较高的门槛,受制于数据、算力的限制,真正能跑通大模型商业化的企业数量将不会很多。现在国内的大模型还在实验室阶段,厂商需要更多时间和资源去训练模型、调试参数等,市场竞争环境有利于产业发展,最后必然是大浪淘沙。”

(责任编辑:AK007)