如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
来源:
编辑:
时间:2025-06-22 05:00:10

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章
- 国际首次!嫦娥六号月壤研究有新进展 专家解析两种材料特别之处_单壁_缺陷_月球
- 一盒近600万元,堪比一套房!记者实探深圳华强北存储市场,涨价预计将持续至2026年底_内存_服务器_李先生
- 2025-2026搜狐趋势盛典|圆桌对谈:AI驱动的硬件新范式_产品_用户_潘志东
- 武松杀嫂,为什么要先扯开她的胸衣,多此一举还是另有深意?
- 俞敏洪盯上的万亿市场,早已跑出个“超级玩家”_红松_老年人_李乔
- 2026沉浸式娱乐趋势下,上海KTV如何转型“自助式社交声场”?_世代_情绪_用户
- 小米最强旗舰芯片!玄戒O2继续使用台积电3nm工艺_应用_消息_产品
- 雷军宣布小米汽车推出七年低息政策 受特斯拉启发_用户_直播_方案
- 大模型变现元年后,智能体会不会一地鸡毛?_Agent_企业_用户
- 广西经济还有希望么?

热门文章
- 半年失业预警、中美差距仅6个月、AI泡沫论…达沃斯聚光灯下,AI巨头掌舵人激辩_岗位_哈萨比斯_技术
- 男的真的会把所有衣服从上到下都扔洗衣机吗?
- 300万一张票,90后美女主持送黄景瑜“上天”_穿越_商业_飞船
- 中国第一大民营企业诞生!反超华为和阿里,67万员工创下万亿收入_物流_资产_商业
- AI大事!马斯克:索赔9300亿元_OpenAI_广告_ChatGPT
- 为什么我感觉广西未来会撤自治区改省?
- 内网设备,USB口被禁用,只能连接鼠标和键盘,有什么办法可以实现数据拷入?
- 东北霸总,为什么用不了折叠屏?_手机_抗冻_柔性
- 半年失业预警、中美差距仅6个月、AI泡沫论…达沃斯聚光灯下,AI巨头掌舵人激辩_岗位_哈萨比斯_技术
- 钱再多有啥用!50岁久居英国的李湘,终于为自己的行为付出了代价_注销_生活化_直播


