设置

日夜间

随系统

浅色

深色
主题色

黑色

首页 > 财经

阿里发布Qwen2-Math：数学推理全球第一，超越GPT-4o和Claude-3.5

2024-08-10 07:49:30 来源：观察者网

观看：23

Qwen官方网站消息，8月8日，阿里发布了Qwen2-Math（1.5B/7B/72B）系列。Qwen2-Math是一系列基于Qwen2 LLM构建的专门用于数学解题的语言模型，数学推理能力全球第一。

Qwen团队表示，Qwen2-Math是基于Qwen2大型语言模型构建的一系列专业数学语言模型，其数学能力显著超越了开源模型甚至闭源模型（例如GPT-4o）。希望Qwen2-Math能够为解决复杂的数学问题做出社区贡献。

Qwen团队表示，一系列数学基准评测结果表明，阿里最大的数学专用模型Qwen2-Math-72B-Instruct超越了最先进的模型，包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro和Llama-3.1-405B。

Qwen团队介绍，Qwen2-Math的基础模型以Qwen2-1.5B/7B/72B为起点，然后在精心设计的数学专业语料库上进行预训练。该语料库包含大规模高质量的数学网络文本、书籍、代码、考试题目以及由Qwen2合成的数学预训练数据。

团队使用中英文的数学基准评测对Qwen2-Math-72B-Instruct进行评估。除了常用的GSM8K和Math基准评测，还加入了更具挑战性的考试，例如，OlympiadBench、CollegeMath、中考、高考等。

本文链接：阿里发布Qwen2-Math：数学推理全球第一，超越GPT-4o和Claude-3.5http://www.llsum.com/show-3-31767-0.html

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：苹果AI或每月收费143元，“果粉”会买单吗？

下一篇： Figure 02发布，人形机器人的未来真是1万美元一台？

热门资讯

恒大地产再被执行6.1亿，累计被执行超472亿
　　中新经纬2月21日电中国执行信息公开网显示，近日，恒大地产集团有限公司(下称恒大地产)新增21条被执行人信息，执行标的合计6.1亿余元。中国执行信息公开网截图　　具体来看，
外媒：美大型银行房地产坏账超过准备金
　　中新经纬2月21日电据英国《金融时报》消息，在与写字楼、购物中心和其他房地产有关的逾期付款急剧增加后，商业房地产不良贷款已经超过美国最大银行的损失准备金。　　《金
A股低开，ST股、脑机接口板块逆市活跃
　　中新经纬2月21日电周三，A股三大指数集体低开，沪指低开0.57%，深成指低开0.86%，创业板指低开1.02%。　　Wind截图　　盘面上，医药、券商、汽车跌幅靠前；AI应用概念股出现分化，CP
从抖音、小红书等平台挖人消息称支付宝再次涉足社交领域_小红书新型骗局
IT之家 2 月 23 日消息，《中国企业家》杂志从知情人士处了解到，支付宝 2023 年陆陆续续从抖音、小红书等平台挖了很多员工，主要集中在运营岗和广告岗，为内容布局做储备。报道称，
新春走基层 | 赋能京津冀产业协同发展天津篇章_京津冀产业链协同
新春走基层 | 赋能京津冀产业协同发展天津篇章通信产业网|2024-02-23 14:50:35作者：胡媛来源：通信产业网【通信产业网讯】（记者胡媛）京津冀地区作为全国一体化算力网络国家枢
雷军在线求助：经常看到小米汽车的各种谣言咋办？_雷军小米汽车
2月23日消息:近日，小米汽车的谣言在网络上满天飞，引起了广泛关注。雷军作为小米的创始人，对此感到非常困扰，并在微博上向网友求助，询问如何应对这些谣言。此前，针对有媒体爆料称
沪指重回3000点，谁是反弹急先锋？
21世纪经济报道记者庞华玮广州报道A股走出“八连阳”，上证指数收复3000点大关。2月23日，上证指数收于3004.88点，突破半年线。业内普遍认为，
多家央企业绩考核措施“上新”，央国企改革受险资关注
　　多家央企业绩考核措施“上新”，央国企改革受险资关注　　今年央企负责人业绩考核指标有望于近期落地，其中将增加市值管理考核相关指标，并按“一企一策”进行设计。在去年中
致远新能被责令改正
　　中新经纬2月23日电因1.24亿元募集资金置换自筹资金事项未经董事会审议通过等违规行为，致远新能被责令改正。　　致远新能公告截图　　致远新能23日盘后公告，公司于2月22
山姆的“穷鬼套餐”火了，4亿中产汗流浃背！
编排 | 李砚审核 | 李砚来源 | 品牌头版近年来，受宏观经济环境影响，在大众消费领域，消费降级趋势
巴菲特与阿贝尔接受全球投资者提问「确认阿贝尔为接班人！巴菲特2024年股东信一图看懂」
快科技2月25日消息，日前，巴菲特旗下伯克希尔哈撒韦公司发布2023财年年报，同时，巴菲特人生中第46封股东信对外公布。信中，巴菲特确认了格雷格阿贝尔（Greg Abel）将作为伯克希尔哈撒韦
2030年前实现首次载人登月！中国航天员登月过程揭秘_中国航天载人登月
快科技2月25日消息，日前，中国载人月球探测任务新飞行器名称公布，新一代载人飞船命名为梦舟”，月面着陆器命名为揽月”。它们将与长征十号运载火箭一起，完成中国载人月球探测任务

推荐资讯

特斯拉 Model 3 高性能焕新版通过韩国新车认证：215+412 马力双电机，续航 430km
3 月 6 日消息，特斯拉全新的 Model 3 Performance 焕新版现已通过韩国认证，并揭示了部分关于这款新车的参数信息。这款新车采用了前置 3D3 感应异步电动机 + 后置 4D2
国资委：将对三家中央车企进行单独考核
3月5日，十四届全国人大二次会议首场“部长通道”在人民大会堂举行。国务院国有资产监督管理委员会党委书记、主任张玉卓受邀接受采访时表示，今年中央企业将聚焦“高”“质
预计年内上市阿尔卑斯DOM路试谍照曝光
3月5日，从国内社交平台处获取到了一组疑似蔚来子品牌阿尔卑斯旗下的SUV车型路试谍照（内部代号为DOM）。据悉，阿尔卑斯主攻20-30万元新能源汽车市场，全系车型将基于蔚来第三代
（两会声音）全国人大代表冯兴亚：建议明确智能驾驶法律责任认定
　　(两会声音)全国人大代表冯兴亚：建议明确智能驾驶法律责任认定　　中新网北京3月4日电 (记者王华) 全国人大代表、广汽集团总经理冯兴亚建议，修订相关法律法规，明确智能驾
广汽埃安 AION V Plus 车型 80 Max 版官降 2.3 万元，现价 20.99 万元
3 月 7 日消息，汽车领域的降价潮来袭，广汽埃安今日宣布 AION V Plus全系车型至高官降 2.3 万元。查询埃安官网发现，本次降价只涉及AION V Plus 的顶配车型 80 Max 版，原
东风公司王建清两会建议：创新企业用工机制
2024年全国两会期间，东风公司全国人大代表王建清带来4项与汽车产业相关建议，包括《关于创新用工机制吸引高技能人才稳岗建功的建议》《关于推动新能源汽车产业高质量发展
专访北京知产法院副院长宋鱼水：依法适用惩罚性赔偿，加大恶意侵权打击
21世纪经济报道记者郑雪北京报道保护知识产权就是保护创新。伴随人工智能产业发展如火如荼，知识产权保护越发重要和紧迫。AI训练数据侵权
江西委员两会提案：优化高速免费通行政策
近日，全国两会期间，江西政协委员、江西省市场监督管理局副局长谭文英建议：将现行的部分法定节假日高速免费通行政策，调整为每辆车按年享受固定免费通行时长，让公众高速出行更
Euro NCAP颁布新规：鼓励保留必要物理按键
近日，欧洲新车安全评价机构Euro NCAP表示，将在2026年实施的新规则中要求车辆拥有必要的物理按键来控制基本功能，否则无法得到五星成绩。　　目前，几乎所有的汽车制造商都在
全国政协委员陈伟志：规范学校办学，把课间十分钟还给学生
21世纪经济报道记者王峰北京报道当前，不少中小学“课间十分钟消失”，十分不利于学生身心健康发展。全国政协委员、民革中央委员、上海新
北汽集团称“在韩国高阳建厂”信息不实
　　中新经纬3月8日电 7日晚，北汽集团官方微博发布声明称，“在韩国高阳建厂”的相关报道不实。　　声明显示，北汽集团发现部分韩国媒体发布了关于“北汽和韩国高阳市签订合作备
网约车追尾1000万兰博基尼：300万三者险非常有必要买！
3月9日消息，开车上路，保险一定要买，而且要尽可能地买多一些，比如300万的三者险，以防万一。近日，一起“非常贵”交通事故的发生，引起了网民广泛关注和讨论。据

日榜
周榜
月榜