国产大模型如雨后春笋般爆发 “具身智能”会否成AI的下一个浪潮?

  中国网科技7月17日讯(记者 张润琪)在过去半年,随着ChatGPT的火热出圈,AI大模型在全球掀起一轮开发浪潮,国内的各界大神相继公开了自家的大模型产品。如今,人们的关注点也不再是“中国何时造出ChatGPT”、“国产大模型能否迎头赶上”的初级阶段,而是国内大模型如何构建自身优势,未来的AI之路将走向何方?

  公开报道显示,据不完全统计,截至7月初,国内10亿级参数规模以上的人工智能大模型已超80个。例如,百度的“文心”系列、阿里云的“通义”系列、华为云的“盘古大模型”、京东云的“言犀”、商汤的“日日新”、科大讯飞的“星火”、出门问问的“序列猴子”、第四范式的“式说”等产品。AI 大模型兴起和快速发展即将推动我们进入第四次工业革命,对互联网的关键技术、架构体系、产业发展、应用模式产生变革性影响。

  今年6月份,中国工业互联网研究院发布了《通用人工智能大模型工业领域知识问答性能评估报告》,报告聚焦评测人工智能大模型在中文工业领域的知识问答能力,通过选取工业领域典型的八大行业,构建知识测试集,对国内外具有代表性的若干大模型进行评测。同时,报告选取了性能前六名的模型进行公布,分别是GPT4、GPT3.5、文心一言、ChatGLM、360智脑、天工大模型。

  报告结论显示,当前,通用大模型在工业知识问答领域探索处于初级阶段,GPT4仍然是最高水平;国内大模型整体水平与GPT3.5持平,头部梯队表现优异,已在部分行业实现赶超。

  不过,中国工业互联网研究院的报告也揭示出通用大模型落地垂直行业的痛点,缺乏特定行业的专业知识。例如,报告提到大模型在处理不同工业知识问答时,表现出较大差异,行业间泛化能力有待加强;互联网信息量较小的行业,大模型知识问答能力较弱,缺乏该行业针对性训练和微调等。

  这份评估报告通过数据直观的指出了通用模型虽然像“百科全书”一样,能够适用不同的产业土壤,但在某个单项领域的专业性上会有所欠缺。那么,是不是垂直大模型才是未来的主战场呢?还是做通用大模型和做垂类大模型的将走向融合道路?

  “通用大模型和行业大模型并不是对立的。”腾讯云副总裁吴运声表示,通用大模型是解决一些通用的问题,通用的问题可能是在与行业的结合深度不太紧的情况下。如果需要解决在行业里面特别深入的问题,还是需要专属的行业模型。

  科大讯飞在接受中国网记者采访时提到,讯飞星火认知大模型从攻关启动便已明确“1+N”的体系,其中1是指通用认知大模型,N指的是大模型在教育、医疗、工业、汽车、办公等各个领域的落地。之所以“1+N”同步进行,一方面是此前讯飞在“N”的行业领域中有较好的业务和场景基础,第二也是因为“N”会让“1”的能力持续迭代进化,所以双方是互相促进、共同进步的。大模型和专业模型结合,能够在专业领域和任务上发挥重要作用。

(责任编辑:AK007)