大模型竞速绝非“大厂游戏”

日期：2023-04-13 12:52 来源：互联网

　　4月11日，阿里云大模型通义千问正式官宣。近日，大模型领域“新兵”不断涌现，王小川的百川智能、商汤科技“日日新”、昆仑万维“天工”……无论是否与互联网领域直接相关，企业们入局ChatGPT的速度与热情丝毫不受影响。越来越多的互联网大佬下场创业，体量较小的企业也纷纷推出自己的大模型。围观者惊叹，原来高投入的大模型从来都不只是“大厂之间的游戏”，大家争分夺秒的到底在争抢什么？

　　“诸神之战”

　　一天之内，大模型领域迎来了三位重量级的嘉宾。

　　先是搜狗公司创始人王小川，一封公开信正式宣告了“百川智能”的诞生。据了解，百川智能旨在打造中国版的OpenAI基础大模型及颠覆性的上层应用。

　　紧接着，两家公司先后官宣。在当天的技术交流日上，商汤科技董事长兼CEO徐立展示了“日日新”体系下的语言大模型“商量”，据悉，这是一个1800亿参数的中文大语言模型，可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。

　　与此同时，昆仑万维也表示，即将推出对标ChatGPT的双千亿级大语言模型“天工”3.5，并定于4月17日启动邀请测试。当晚，昆仑万维发布2022年年报，明确提到“未来10年将坚定的‘All in’AGI与AIGC。”

　　大模型成了这一轮AIGC浪潮的兵家必争之地。百度“文心一言”、阿里“通义千问”、腾讯“混元”、京东“ChatJD”、华为“盘古”，传统大厂无一掉队。

　　垂直领域诸多企业纷纷入局，除商汤科技及昆仑万维外，科大讯飞也在互动平台表示，将于5月6日发布讯飞预训练大模型的详细信息，大模型将用于教育、翻译等领域。

　　互联网大佬们更不畏惧大模型的“从0到1”。公开报道显示，王慧文的 “光年之外”A 轮融资后估值已达到10亿美元，前商汤科技副总裁闫俊杰新公司MiniMax的首款大模型产品Glow累计用户已突破百万。

　　华西证券研报总结了现有国产大模型的两个特征：一是头部厂商主导，to B为主要模式，赋能原有优势业务；二是均未对公众大面积开放，未有明确的to C入口，实际水平不透明。

　　通用还是垂直

　　AIGC产业主要分为基础和应用两个层面，前者包含理论框架的搭建、大模型的训练以及算法等，大投入、智力密集和长期性三个特点缺一不可。而后者主要是将别人开发出的东西与自己的业务进行整合，见效快，成本相对也较低。

　　而这也是当下中国AIGC企业押注的两个方向。有人势要成为中国的OpenAI，但也有人将目光瞄准了垂直领域的应用。

　　天使投资、资深人工智能专家郭涛表示，根据AI大模型应用范围的不同，可以分为通用型大模型和产业型大模型，通用型AI大模型在企业级与消费级市场都拥有广泛的应用场景，如OpenAI旗下的ChatGPT；而产业型的AI大模型主要应用于垂直行业或细分应用场景，如京东旗下的ChatJD。

（责任编辑：AK007）

大模型竞速绝非“大厂游戏”

相关推荐