4月11日,阿里云大模型通义千问正式官宣。近日,大模型领域“新兵”不断涌现,王小川的百川智能、商汤科技“日日新”、昆仑万维“天工”……无论是否与互联网领域直接相关,企业们入局ChatGPT的速度与热情丝毫不受影响。越来越多的互联网大佬下场创业,体量较小的企业也纷纷推出自己的大模型。围观者惊叹,原来高投入的大模型从来都不只是“大厂之间的游戏”,大家争分夺秒的到底在争抢什么?
“诸神之战”
一天之内,大模型领域迎来了三位重量级的嘉宾。
先是搜狗公司创始人王小川,一封公开信正式宣告了“百川智能”的诞生。据了解,百川智能旨在打造中国版的OpenAI基础大模型及颠覆性的上层应用。
紧接着,两家公司先后官宣。在当天的技术交流日上,商汤科技董事长兼CEO徐立展示了“日日新”体系下的语言大模型“商量”,据悉,这是一个1800亿参数的中文大语言模型,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。
与此同时,昆仑万维也表示,即将推出对标ChatGPT的双千亿级大语言模型“天工”3.5,并定于4月17日启动邀请测试。当晚,昆仑万维发布2022年年报,明确提到“未来10年将坚定的‘All in’AGI与AIGC。”
大模型成了这一轮AIGC浪潮的兵家必争之地。百度“文心一言”、阿里“通义千问”、腾讯“混元”、京东“ChatJD”、华为“盘古”,传统大厂无一掉队。
垂直领域诸多企业纷纷入局,除商汤科技及昆仑万维外,科大讯飞也在互动平台表示,将于5月6日发布讯飞预训练大模型的详细信息,大模型将用于教育、翻译等领域。
互联网大佬们更不畏惧大模型的“从0到1”。公开报道显示,王慧文的 “光年之外”A 轮融资后估值已达到10亿美元,前商汤科技副总裁闫俊杰新公司MiniMax的首款大模型产品Glow累计用户已突破百万。
华西证券研报总结了现有国产大模型的两个特征:一是头部厂商主导,to B为主要模式,赋能原有优势业务;二是均未对公众大面积开放,未有明确的to C入口,实际水平不透明。
通用还是垂直
AIGC产业主要分为基础和应用两个层面,前者包含理论框架的搭建、大模型的训练以及算法等,大投入、智力密集和长期性三个特点缺一不可。而后者主要是将别人开发出的东西与自己的业务进行整合,见效快,成本相对也较低。
而这也是当下中国AIGC企业押注的两个方向。有人势要成为中国的OpenAI,但也有人将目光瞄准了垂直领域的应用。
天使投资、资深人工智能专家郭涛表示,根据AI大模型应用范围的不同,可以分为通用型大模型和产业型大模型,通用型AI大模型在企业级与消费级市场都拥有广泛的应用场景,如OpenAI旗下的ChatGPT;而产业型的AI大模型主要应用于垂直行业或细分应用场景,如京东旗下的ChatJD。