首页
Portal
夜鸦社区
BBS
男生发帖
女生发帖
内容导读
Guide
圈子
Group
登录
注册
夜鸦SM社区
»
夜鸦社区
›
交流
›
闲话杂谈
›
挑战高考数学卷,十大模型测评来了:AI刷题强到可怕? ...
挑战高考数学卷,十大模型测评来了:AI刷题强到可怕?
runtu
2025-6-11 08:52:07
|
显示全部楼层
|
阅读模式
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。
《每日经济新闻》记者(以下简称“每经记者”)选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯元宝(混元T1)、OpenAI的o3、谷歌的Gemini 2.5 Pro和xAI的Grok3等十款AI推理大模型进行了测评,以检验当今主流AI推理大模型的数学能力。
测评结果显示,国产大模型DeepSeek-R1与腾讯混元T1以零错误并列榜首。而被马斯克称为“地表最强AI”的Grok 3却遭遇“滑铁卢”,排名倒数第三。
道具
举报
回复
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
主题回复
倒序浏览
78
查看
2
回复
runtu
2025-6-11 08:52:29
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。
《每日经济新闻》记者(以下简称“每经记者”)选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯元宝(混元T1)、OpenAI的o3、谷歌的Gemini 2.5 Pro和xAI的Grok3等十款AI推理大模型进行了测评,以检验当今主流AI推理大模型的数学能力。
测评结果显示,国产大模型DeepSeek-R1与腾讯混元T1以零错误并列榜首。而被马斯克称为“地表最强AI”的Grok 3却遭遇“滑铁卢”,排名倒数第三。
举报
回复
照妖镜
runtu
2025-6-11 08:58:30
举报
回复
照妖镜
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
注册
本版积分规则
发表回复
回帖后跳转到最后一页
最佳新人
注册账号后积极发帖的会员
runtu
帖子 26 篇
关注
私信
测试一下
测试1
123123123
123
© 2001-2025
夜鸦SM社区
Archiver
手机版
小黑屋