《报告》指出,当前国产大模型产品已具有显著进步,但与接受过高等教育的人类相比,在智商、情商等方面仍存在一定程度差距。
《报告》选取 360 智脑、百度文心一言、澜舟 Mchat、商汤商量、讯飞星火、阿里通义千问、昆仑天工、智谱 ChatGLM 共 8 种大模型产品进行评测,根据基础能力、智商能力、情商能力、工具提取四个维度计算总分。IT之家附总分排名如下:
-
讯飞星火:1013 分
-
百度文心一言:1010 分
-
商汤商量:983 分
-
智谱 ChatGLM:983 分
-
360 智脑:951 分
-
昆仑万维天工:943 分
-
阿里通义千问:935 分
-
澜舟 Mchat:932 分





据介绍,讯飞星火“在工作提效方面优势明显”,百度文心一言“地基深厚、基础能力仍处领军水准”,商汤商量则“在情商方面表现优秀”,智谱 AI 的 ChatGLM 整体表现优秀。
同时,AI 技术发展的重点已经从大模型的盲目追求转向了实用性和可持续性的发展,AI 大规模落地需要更多时间来验证。
《报告》原文:点此查看。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 新华社研究院发布国产大模型报告,讯飞星火、百度文心一言分列 TOP 2

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





