设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

阿里发布Qwen2-Math:数学推理全球第一,超越GPT-4o和Claude-3.5

2024-08-10 07:49:30 来源: 观察者网

Qwen官方网站消息,8月8日,阿里发布了Qwen2-Math(1.5B/7B/72B)系列。Qwen2-Math是一系列基于Qwen2 LLM构建的专门用于数学解题的语言模型,数学推理能力全球第一。3Rz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Qwen团队表示,Qwen2-Math是基于Qwen2大型语言模型构建的一系列专业数学语言模型,其数学能力显著超越了开源模型甚至闭源模型(例如GPT-4o)。希望Qwen2-Math能够为解决复杂的数学问题做出社区贡献。3Rz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3Rz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Qwen团队表示,一系列数学基准评测结果表明,阿里最大的数学专用模型Qwen2-Math-72B-Instruct超越了最先进的模型,包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro和Llama-3.1-405B。3Rz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Qwen团队介绍,Qwen2-Math的基础模型以Qwen2-1.5B/7B/72B为起点,然后在精心设计的数学专业语料库上进行预训练。该语料库包含大规模高质量的数学网络文本、书籍、代码、考试题目以及由Qwen2合成的数学预训练数据。3Rz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

团队使用中英文的数学基准评测对Qwen2-Math-72B-Instruct进行评估。除了常用的GSM8K和Math基准评测,还加入了更具挑战性的考试,例如,OlympiadBench、CollegeMath、中考、高考等。3Rz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3Rz流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:阿里发布Qwen2-Math:数学推理全球第一,超越GPT-4o和Claude-3.5http://www.llsum.com/show-3-31767-0.html

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 苹果AI或每月收费143元,“果粉”会买单吗?

下一篇: Figure 02发布,人形机器人的未来真是1万美元一台?

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜