感谢IT之家网友 内含子 的线索投递!
中国信通院联合工作组 60 余家单位,共同研制了《大规模预训练模型技术和应用评估方法》系列标准,包含模型开发、模型能力、模型应用和可信要求四个重要部分。目前模型开发、模型能力两部分标准已发布,模型开发标准包括数据构建、模型训练、模型管理、模型部署 4 个能力域、16 个能力子域、60 余个能力项,全面评估研究主体开发大模型的能力。
模型能力标准包含功能丰富度、性能优越度、服务成熟度 3 个评测维度、8 个能力域、30 余个能力项,全面评估大模型的各项技术能力。模型应用标准初步定稿,包含应用丰富度、服务成熟度、运营管理能力 3 个能力域、14 个能力子域、30 余个能力项,综合评估大模型应用成熟度。可信要求标准正在前期研究中,近期将启动编制工作。
IT之家从官方获悉,中国科学院自动化研究所、武汉人工智能研究院研发的“紫东太初”大模型,在 2 月 12 日-3 月 3 日参与可信 AI 评测工作,模型开发和模型能力两部分获得 4 + 级评分,成为国内首家通过该项评测的学术机构。

未经允许不得转载:新聚网 » 中国信通院“可信 AI”大模型评测完成,近期启动编制工作

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





