27 亿参数，微软发布 Phi-2 模型：某些性能指标优于 Llama-2-7B

IT之家注：微软于今年 6 月发布 Phi-1，只有 13 亿参数，适用于 QA 问答、聊天格式和代码等等场景。该模型完全基于高质量数据进行训练，在基准测试中的表现比同类模型高出 10 倍。

微软今年 9 月更新发布了 Phi-1.5 版本，同样为 13 亿参数，可以写诗、写电子邮件和故事，以及总结文本。在常识、语言理解和推理的基准测试中，该模型在某些领域能够跟上多达 100 亿个参数的模型。

微软现在更新发布的 Phi-2 拥有 27 亿参数，规模虽然比此前版本翻番，但相比较其它主流语言模型，依然小很多。

微软表示 Phi-2 在逻辑推理和安全性方面显示出显著的改进。通过正确的微调和定制，小型语言模型是云和边缘应用程序的强大工具。

Microsoft Research 机器学习基础小组负责人 Sebastien Bubeck 在 Twitter 上发布了“MT-Bench”基准测试的屏幕截图，该基准测试了具有强大语言模型（例如 GPT-4）的大型和小型语言模型的实际功能。

27 亿参数，微软发布 Phi-2 模型：某些性能指标优于 Llama-2-7B

根据结果，Phi-2 在某些方面优于 Meta 的 Llama-2-7B 模型。Phi-2 的聊天版本也在酝酿中，可能会解决该模型在这些领域的一些现有痛点。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。