模型简介
该模型共有 1230 亿个参数,在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。
Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面有非常明显的改进。
Mistral 公司表示,训练的重点之一是尽量减少模型的幻觉问题。该公司称,Large 2 接受的训练让它的反应更具辨别力,当它不知道某些事情时,它会承认自己不知道,而不是编造一些看似合理的事情。
开放方式
IT之家援引官方新闻稿,该 AI 模型的关注点之一,在于“授权开放”非商业研究用途,包括开放权重、支持第三方根据其喜好进行微调(fine-tune)等等。

如果商业 / 企业想要使用 Mistral Large 2,需要从 Mistral 公司购买单独的许可和使用协议。
性能
与 Llama 3.1 的 4050 亿个参数(即指导其性能的内部模型设置)相比,它的参数数量较少,但性能仍接近前者。
Mistral Large 2 可在公司的主平台上使用,也可通过云合作伙伴使用,它建立在原有 Large 模型的基础上,带来了先进的多语言功能,并提高了推理、代码生成和数学方面的性能。
官方称其为 GPT-4 级模型,在多项基准测试中的性能非常接近 GPT-4o、Llama 3.1-405 和 Anthropic 的 Claude 3.5 Sonnet。





Mistral 指出,该产品将继续“推动成本效益、速度和性能的发展”,同时为用户提供新的功能,包括高级函数调用和检索,以构建高性能的人工智能应用。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





