微软 Orca 2 共有 70 亿和 130 亿两种尺寸,部分融合了 Llama 2 LLM 参数,通过融合定制的高质量合成数据,提供更准确、更优秀的合成数据。

微软表示 Orca 2 使用扩展的、高度定制的合成数据集进行训练。Orca 2 支持分步处理、回忆然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。
Orca 2 模型相比较 Llama 2 和 WizardLM 等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解等方面更为优秀。

微软表示:“我们的初步结果表明,Orca 2 的性能明显优于类似尺寸的模型。它还达到了与至少大 10 倍的模型相似或更好的性能水平,展示了为较小模型配备更好推理能力的潜力。”

IT之家附上微软 Orca 2 模型的介绍链接,感兴趣的用户可以深入阅读。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 70 亿 / 130 亿参数,微软研究院发布 Orca 2 LLM:性能媲美 10 倍参数模型

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





