达摩院2023十大科技趋势发布:人类对通用AI的想象从未如此具体

杨净 发自 凹非寺

量子位 | 公众号 QbitAI

刚刚,达摩院十大科技趋势榜单发布。

本次包含了AI、芯片、云计算等基础技术领域,既有引发全球投资浪潮的生成式AI,也有在规模化应用前夜的存算一体、Chiplet设计封装技术……

(先来一睹为快)

但跟以往不同的是,仅从榜单上可以看到,产业、融合等成为此次的关键词。

而在跟达摩院进一步交谈之中,这背后还有更深次的底层逻辑的不同。

达摩院怎么看科技趋势?

延续以往惯例,本次趋势榜单拆分成了三个维度:范式重置、产业革新、场景变换。

如前所述技术维度上看,包括了像AI、芯片、云计算等基础性技术。

AI:多模态预训练大模型、生成式AI;

芯片:Chiplet、存算一体;

云计算:云原生安全、软硬融合云计算体系架构、端网融合的可预期网络。

以及在此基础上各种交叉技术融合,催生出来的新场景、新应用,比如双引擎智能决策、计算光学成像、大规模城市数字孪生。

而从产业的维度,则是聚焦于ICT(Information and Communications Technology)领域,既包括了计算(存储)和通信(网络)两大底层技术,也横向包括了安全(管理)、应用(行业)两大应用领域。

跟以往相比,今年达摩院给出的科技趋势有着不容忽略的关键词,那就是融合。这也是在与达摩院交谈中,谈及最多的趋势。

有计算与通信的融合、硬件与软件的融合、数字技术与产业融合……这其中最显性、呈现出应用大爆发盛况,是AI技术与行业之间的融合。

在这方面,达摩院今年重点看向了有望重置范式的多模态预训练大模型,以及激发更多场景的生成式AI

多模态预训练大模型

AI正从文本、语音、视觉等单模态智能,朝着多种模态融合的通用AI方向发展,这一点在过去一年已被广泛感知了。

典型进展包括OpenAI提出的图像文本匹配模型CLIP。以爆火的Stable DIffusion为代表的AI绘画领域, 背后基本上都是围绕着CLIP展开。

还有在“在所有事情上打败所有人”的微软多模态基础模型BEiT-3。该模型仅靠19亿参数,只用公共数据集,在12个任务上狂刷SOTA,甚至还包括了纯视觉任务。

(责任编辑:AK007)