面壁智能发布 Eurux-8x22B 开源大模型：代码性能超越 Llama3-70B

感谢IT之家网友風見暉一的线索投递！

官方测试中，Eurux-8x22B 在 LeetCode（180 道 LeetCode 编程真题）与 TheoremQA （IT之家注：美国大学水准的 STEM 题目）测试上超越了 Llama3-70B，在 LeetCode 测试上超越闭源的 GPT-3.5-Turbo。

官方测试结果

▲ 官方测试结果

据介绍，Eurux-8x22B 模型激活参数 39B，支持 64k 上下文，是由 Mixtral-8x22B 模型对齐而来，在 UltraInteract 对齐数据集上训练而成。

官方测试数据

▲ 官方测试数据

UltraInteract 是专门设计用于提升大模型推理能力的大规模、高质量的对齐数据集，包含了覆盖数学、代码和逻辑推理问题的 12 个开源数据集的 86K 条指令和 220K 偏好对，共有五十万条左右数据。

UltraInteract 过程

UltraInteract 示例

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。