半路杀出个程咬金!奇瑞联手科大讯飞:全球最早大模型上车

芜湖起飞!

不是玩梗,而是AI最前沿和智能汽车产业,刚刚在安徽芜湖交汇碰撞。

科大讯飞最新发布的大模型星火,官宣上车奇瑞新车星纪元ES。

半路杀出个程咬金!奇瑞联手科大讯飞:全球最早大模型上车

全球AI行业、汽车产业中,这是大模型首次明确搭载量产智能车,是深度联合开发,首发搭载,不是后期OTA那种。

大模型到底怎么上车?对智能汽车有啥意义?

这些被追问近一年的问题,奇瑞汽车和科大讯飞第一次尝试解答。

什么大模型

科大讯飞3个月前才刚刚发布的“星火”大模型,前两天刚刚发布了最新的V2.0版本。

星火模型能干什么?包含7大核心能力——

多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力。

半路杀出个程咬金!奇瑞联手科大讯飞:全球最早大模型上车

“上车”现场,科大讯飞董事长刘庆峰又重复了三个月前说过的话:

“尤其在语义理解,长文本生成以及数据能力三方面,已经超过了ChatGPT”。

科大讯飞的依据是,星火大模型包含超过1700亿个参数,来源于数十亿的语言数据集。尽管比ChatGPT 3.5模型1.5万亿个差着数量级,但ChatGPT覆盖了全球主要语言,汉语不到其中10%的数据量。

所以在现有数据基础上,星火大模型比ChatGPT更懂中文。

星火大模型采用了Transformer神经网络结构,这是一种在自然语言处理领域被广泛应用的神经网络结构。

与传统的循环神经网络(RNN)和卷积神经网络(CNN)不同,Transformer可以直接处理整个句子或段落,而不需要分段或分句处理。

这种结构的优点是可以更好地处理长文本序列,避免了传统RNN和CNN在处理长序列时出现的梯度消失和梯度爆炸等问题。

半路杀出个程咬金!奇瑞联手科大讯飞:全球最早大模型上车

训练数据层面,来自中国科学技术大学自主研发的大规模中文文本语料库“中国科技论文数据库”(CSTDP)。包含了超过1.7亿篇中文科技论文,覆盖了多个学科领域,包括计算机科学、物理学、化学、生物学等。

(责任编辑:AK007)