感谢IT之家网友 有鲫雪狐 的线索投递!
“万法”大模型
中国司法大数据研究院紧跟大模型应用发展趋势,积极开展大模型前瞻布局,致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。
经过一年多的积累和沉淀,中国法研的“万法”大模型已经开始对外提供服务。
“法观”大模型简介
“法观”基于“万法”大模型,由中国司法大数据研究院、数智枫桥研究院联合设计研发,天同作为实务共建单位共同部署。“法观”产品将于 8 月 10 日开放公测。
结果
Lawbench 测试得分为 64.38 分,超过北京大学法学院的 Chatlaw(60.08 分)及美国 OpenAI 的 ChatGPT-4(52.35),暂列全球第一。

IT之家注:Lawbench 则是一个由南京大学和上海人工智能实验室联合构建的中文法律问答模型评估数据集,旨在全面评估大型语言模型在法律领域的实际性能表现。
该数据集包含三个关键维度:法律知识记忆、法律知识理解、法律知识应用,涵盖 20 个子测评项,覆盖单选、多选、回归、抽取和生成等五大类法律专业任务。
“法观”以客观题 182 分及主观题优秀表现,实测通过中国法律职业资格考试(学习资料中不包括考试题目,属于真考),成为全球首个通过中国法考的人工智能产品。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » “法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





