商汤联合创始人、首席科学家王晓刚认为,商汤入局大模型有两个优势:第一是基础设施,第二是商汤在过去几年深入行业和场景,积累了各种各样多模态任务,这些好比是原材料。
腾讯新闻《潜望》刘勇
2023年4月10日,商汤科技SenseTime举办技术交流日活动,公布以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并公布商汤在该战略下的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
活动上,商汤展示了“日日新SenseNova”大模型体系下的语言大模型,以及AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,并公布了商汤依托AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。
据悉,商汤大装置上共有27000块GPU芯片卡,可以输出5.0 exaFLOPS总算力,是亚洲目前最大的智能计算平台之一。
为什么叫“日日新”? 商汤方面表示,“苟日新,日日新,又日新”选自中国儒家经典——《礼记·大学》,意思是如果能够一天新,就应保持天天新,新了还要更新。这就像“日日新”大模型给产业带来的全新的生产力革命,在商汤科技已经将AGI的服务沁入企业生产及生活中,悄然掀起了一场生产力的革新风暴。
商汤科技董事长兼CEO徐立在10日发布会表示:“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。我们以AI大装置SenseCore打造AGI时代的基础设施。”
“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”商汤科技联合创始人、首席科学家王晓刚表示:“商汤已建立了全栈的大模型研发体系,并已在多个行业场景中落地,场景的多样性,任务的复杂度,数据的丰富度均充分展示了我们大模型的能力和未来潜力。我们将持续推动基础设施建设,期待和合作伙伴一起投入到AGI的时代大潮中。”
日前,王晓刚在谈及商汤进入大模型领域的优势时说,他认为商汤优势有以下两方面: