如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-19 19:20:11
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-20 22:00:11有没有一个特别好用的Linux系统?
- 2025-06-20 22:10:11跨平台GUI框架到底应该自绘还是原生控件绑定?
- 2025-06-20 22:25:11汉语是牺牲了什么,才成为世界最紧凑、最高效的语言?
- 2025-06-20 21:20:10各位历史发烧友,介绍一下你知道的冷门史实或逆天史实?
- 2025-06-20 22:05:11有哪些看似精妙实则很蠢的设计?
- 2025-06-20 22:45:11组nas一定要TDP低的cpu吗?
- 2025-06-20 22:10:11有哪些开源web应用漏洞扫描工具?
- 2025-06-20 22:35:13中国有能打到美国本土的导弹吗……有的话最远能打到哪里呢?
- 2025-06-20 22:30:11消息称三大运营商将于今年下半年全面重启eSIM,eSIM有哪些好处?为何此前暂停这一业务?
- 2025-06-20 21:20:10055驱逐舰 是个什么概念?
推荐产品
-
你卡过最厉害的bug是什么?
我娃卡出来的bug, 现在的孩子吧,给手机就不好好学习。 不 -
女明星做了什么医美项目保持童颜?
就在近日,许久不曾现身在大众面前的杨颖因为参加了一场活动而引 -
***咖被曝员工月薪 2300 元只休 1 天,这样的薪资和工作条件是否合理?
正常,河南工资就这么低, 不然你以为“河南人可以润两次”是开 -
华为 HDC 发布 HarmonyOS 6 开发者 beta 版对应用开发者和鸿蒙生态有哪些影响?
每年松山湖HDC,对聚集在鸿蒙旗下的这群老开发者来说,有点像
新闻动态
最新资讯

