文 | 周鑫雨 邓咏仪 编辑 | 杨轩 苏建勋
36氪从多处独立信源获悉,阿里M6大模型的前带头人杨红霞已加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发。
一名知情人士对36氪表示,杨红霞在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。36氪就上述消息向字节跳动求证,截至发稿前暂未收到回复。
杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人,毕业于南开大学、杜克大学统计科学系,师从著名统计学家David Dunson。她在人工智能领域国际会议、顶级期刊有近百篇顶级论文。
2022年9月初,杨红霞因个人家庭原因从阿里巴巴达摩院离职。
M6是阿里巴巴达摩院研发的超大规模多模态预训练模型,而大模型是本轮AI浪潮中的竞争核心。
杨红霞曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。2021年3月,M6大模型首次发布,到2021年底,阿里云发布M6最新进展时,其参数已至10万亿,成为当时全球最大的AI预训练模型。
而达摩院在大模型的落地上,也走在业界前列。2022年底,阿里云魔搭社区开源超过300个AI大模型,包括M6、通义大模型等等,为开发者提供基础AI模型资源。
不过,由于达摩院AI大模型离实际业务落地还是较远,加上大厂降本增效的背景,业务无法落地也无法得到更多支持,这也导致包括杨红霞在内的多位顶级人才离职,如智能研究领域负责人金榕、城市大脑实验室负责人华先胜。
从前美团联合创始人王慧文、出门问问CEO李志飞、前京东技术掌门人周伯文相继发布英雄帖寻找研发人才,再到“投人”的逻辑将不少技术大拿的AI创业项目估值拉上亿元美金,国内AI界的人才大战已经爆发。
对大模型的研发而言,人才在一定程度上决定了算法能力的上限。不少从业者都表示,资金、数据、算力等难题至少有解法可循,但算法这一必定需要人参与的环节,对人的能力提出了很高的要求。“好的算法能够在提高执行效果和效率同时,还能尽量缩减存储量。”一名AI从业者告诉36氪。
多名知情者告诉36氪,目前图像生成大模型的进展较为顺利,将与抖音、剪映等产品进行结合。但语言生成大模型由于起步晚、基础薄弱等原因,目前效果尚未达到团队预期。字节跳动相关技术负责人也对此做出了回应:技术中台在这些领域有探索,还很初期,不成熟。
百度已用文心一言在大模型角逐中棋先一招,逐渐组建人才团队的字节跳动能否后来居上,还有待时间验证。