设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

4款国产大模型表现超ChatGPT,10款大模型做北京中考数学题_国产模型厂商

2024-06-27 08:11:13 来源:

【】6月26日消息,2024年北京市初中学业水平考试今天结束,中考数学向来是学生和家长关注的重点,而数学试卷主要考查学生对初中数学主干知识的掌握情况和在知识学习过程中核心素养的发展情况。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

此前,我们曾用“9款大模型做高考数学题”,但是效果一般。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

现在,降低难度,用大模型做北京中考的数学题,它们的表现又如何呢?L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

选取百度文心一言、阿里通义、腾讯元宝、字节豆包、ChatGPT,百川智能百小应、零一万物万知、智谱清言、月之暗面的Kimi,好未来九章大模型总计10款大模型来答题。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

其中,零一万物万知PC端不支持上传图片/拍照,这里采用了万知微信小程序来参与答题。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

一共选择数据卷中的3道题进行测试。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1、选择题L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

正确答案:AL6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2、填空题L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

正确答案:L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

第一空 60L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

第二空 C-A-B-DL6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3、解答题L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

正确答案:符合。因为改造后A类物质排放量为34mg/km,小于标准要求的不超过35mg/km。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

统一测试方法:在大模型对话框输入上述3道题的图片,大模型进行图片识别后,再进行答题,最终看答题结果是否正确。解答题除了看结果外,还要考察解答过程是否正确。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

测试结果如下:L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1、九章大模型、元宝、百小应、智谱清言答对3问,表现较好;L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2、通义、豆包、Kimi、ChatGPT答对2问;L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3、文心一言、万知小程序只答对1问。L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

下面附上各AI产品对三道题的答题情况:L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

文心一言3.5解答结果L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

通义L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

元宝L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

豆包L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

百小应L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

万知L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

智谱清言L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

KimiL6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

九章大模型L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

ChatGPTL6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

L6F流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:4款国产大模型表现超ChatGPT,10款大模型做北京中考数学题_国产模型厂商http://www.llsum.com/show-3-25540-0.html

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: l中国联通「中国联通重新定义“China unicom”!」

下一篇: 中国联通引领创新潮流,Open Gateway网络能力开放平台闪耀上海通信展_上海联通网络ai中心

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜