runtu 2025-6-11 08:52:07 | 显示全部楼层 | 阅读模式
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。

backiee-93105.jpg

《每日经济新闻》记者(以下简称“每经记者”)选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯元宝(混元T1)、OpenAI的o3、谷歌的Gemini 2.5 Pro和xAI的Grok3等十款AI推理大模型进行了测评,以检验当今主流AI推理大模型的数学能力。

backiee-98676.jpg

测评结果显示,国产大模型DeepSeek-R1与腾讯混元T1以零错误并列榜首。而被马斯克称为“地表最强AI”的Grok 3却遭遇“滑铁卢”,排名倒数第三。

backiee-109932.jpg



backiee-99922.jpg
backiee-243827.jpg
主题回复
倒序浏览

78查看2回复

runtu 2025-6-11 08:52:29
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。


《每日经济新闻》记者(以下简称“每经记者”)选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯元宝(混元T1)、OpenAI的o3、谷歌的Gemini 2.5 Pro和xAI的Grok3等十款AI推理大模型进行了测评,以检验当今主流AI推理大模型的数学能力。


测评结果显示,国产大模型DeepSeek-R1与腾讯混元T1以零错误并列榜首。而被马斯克称为“地表最强AI”的Grok 3却遭遇“滑铁卢”,排名倒数第三。
举报 回复
runtu 2025-6-11 08:58:30
二维码.png
举报 回复
发新帖
您需要登录后才可以回帖 登录 | 注册

本版积分规则

© 2001-2025 夜鸦SM社区