面壁智能发布 Eurux

感谢IT之家网友 風見暉一 的线索投递!

IT之家 5 月 3 日消息,面壁智能发布开源大模型 Eurux-8x22B,包括Eurux-8x22B-NCA与Eurux-8x22B-KTO,主打推理能力。

官方测试中,Eurux-8x22B 在LeetCode(180 道 LeetCode 编程真题)与TheoremQA (IT之家注:美国大学水准的 STEM 题目)测试上超越了Llama3-70B,在LeetCode 测试上超越闭源的 GPT-3.5-Turbo。

面壁智能发布 Eurux休闲区蓝鸢梦想 - Www.slyday.coM

▲官方测试结果

据介绍,Eurux-8x22B 模型激活参数 39B,支持 64k 上下文,是由 Mixtral-8x22B 模型对齐而来,在 UltraInteract 对齐数据集上训练而成。

面壁智能发布 Eurux休闲区蓝鸢梦想 - Www.slyday.coM

▲官方测试数据

UltraInteract 是专门设计用于提升大模型推理能力的大规模、高质量的对齐数据集,包含了覆盖数学、代码和逻辑推理问题的 12 个开源数据集的 86K 条指令和 220K 偏好对,共有五十万条左右数据。

面壁智能发布 Eurux休闲区蓝鸢梦想 - Www.slyday.coM

面壁智能发布 Eurux休闲区蓝鸢梦想 - Www.slyday.coM

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关推荐

  • 友情链接:
  • PHPCMSX
  • 智慧景区
  • 微信扫一扫

    微信扫一扫
    返回顶部

    显示

    忘记密码?

    显示

    显示

    获取验证码

    Close