【】6月26日消息,2024年北京市初中学业水平考试今天结束,中考数学向来是学生和家长关注的重点,而数学试卷主要考查学生对初中数学主干知识的掌握情况和在知识学习过程中核心素养的发展情况。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
此前,我们曾用“9款大模型做高考数学题”,但是效果一般。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
现在,降低难度,用大模型做北京中考的数学题,它们的表现又如何呢?L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
选取百度文心一言、阿里通义、腾讯元宝、字节豆包、ChatGPT,百川智能百小应、零一万物万知、智谱清言、月之暗面的Kimi,好未来九章大模型总计10款大模型来答题。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
其中,零一万物万知PC端不支持上传图片/拍照,这里采用了万知微信小程序来参与答题。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
一共选择数据卷中的3道题进行测试。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1、选择题L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
正确答案:AL6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2、填空题L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
正确答案:L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
第一空 60L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
第二空 C-A-B-DL6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3、解答题L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
正确答案:符合。因为改造后A类物质排放量为34mg/km,小于标准要求的不超过35mg/km。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
统一测试方法:在大模型对话框输入上述3道题的图片,大模型进行图片识别后,再进行答题,最终看答题结果是否正确。解答题除了看结果外,还要考察解答过程是否正确。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
测试结果如下:L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1、九章大模型、元宝、百小应、智谱清言答对3问,表现较好;L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2、通义、豆包、Kimi、ChatGPT答对2问;L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3、文心一言、万知小程序只答对1问。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
下面附上各AI产品对三道题的答题情况:L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
文心一言3.5解答结果L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
通义L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
元宝L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
豆包L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
百小应L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
万知L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
智谱清言L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
KimiL6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
九章大模型L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
ChatGPTL6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM
本文链接:4款国产大模型表现超ChatGPT,10款大模型做北京中考数学题_国产模型厂商http://www.llsum.com/show-3-25540-0.html
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: l中国联通「中国联通重新定义“China unicom”!」
下一篇: 中国联通引领创新潮流,Open Gateway网络能力开放平台闪耀上海通信展_上海联通网络ai中心