半路杀出个程咬金！奇瑞联手科大讯飞：全球最早大模型上车

日期：2023-08-18 10:10 来源：互联网

芜湖起飞！

不是玩梗，而是AI最前沿和智能汽车产业，刚刚在安徽芜湖交汇碰撞。

科大讯飞最新发布的大模型星火，官宣上车奇瑞新车星纪元ES。

全球AI行业、汽车产业中，这是大模型首次明确搭载量产智能车，是深度联合开发，首发搭载，不是后期OTA那种。

大模型到底怎么上车？对智能汽车有啥意义？

这些被追问近一年的问题，奇瑞汽车和科大讯飞第一次尝试解答。

什么大模型

科大讯飞3个月前才刚刚发布的“星火”大模型，前两天刚刚发布了最新的V2.0版本。

星火模型能干什么？包含7大核心能力——

多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力。

半路杀出个程咬金！奇瑞联手科大讯飞：全球最早大模型上车

“上车”现场，科大讯飞董事长刘庆峰又重复了三个月前说过的话：

“尤其在语义理解，长文本生成以及数据能力三方面，已经超过了ChatGPT”。

科大讯飞的依据是，星火大模型包含超过1700亿个参数，来源于数十亿的语言数据集。尽管比ChatGPT 3.5模型1.5万亿个差着数量级，但ChatGPT覆盖了全球主要语言，汉语不到其中10%的数据量。

所以在现有数据基础上，星火大模型比ChatGPT更懂中文。

星火大模型采用了Transformer神经网络结构，这是一种在自然语言处理领域被广泛应用的神经网络结构。

与传统的循环神经网络(RNN)和卷积神经网络(CNN)不同，Transformer可以直接处理整个句子或段落，而不需要分段或分句处理。

这种结构的优点是可以更好地处理长文本序列，避免了传统RNN和CNN在处理长序列时出现的梯度消失和梯度爆炸等问题。

半路杀出个程咬金！奇瑞联手科大讯飞：全球最早大模型上车

训练数据层面，来自中国科学技术大学自主研发的大规模中文文本语料库“中国科技论文数据库”(CSTDP)。包含了超过1.7亿篇中文科技论文，覆盖了多个学科领域，包括计算机科学、物理学、化学、生物学等。

（责任编辑：AK007）