点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

全部导航

正在阅读：AI大模型能答对几道高考数学题？

首页>

数字化频道> 世界互联网大会乌镇峰会 > 正文

AI大模型能答对几道高考数学题？

来源：世界互联网大会2024-06-13 16:14

　　近日

　　2024年高考作文题等

　　高考相关话题引发热议

　　“AI大模型做高考题”

　　也成为一大看点

　　AI参加高考

　　数学能得多少分

　　悄悄问一句

　　高考数学题

　　你还看得懂吗？

　　或许我们看不懂

　　但大模型可以

　　近日

　　复旦大学NLP（自然语言处理）

　　实验室LLMEVAL团队

　　请来13位大模型“考生”

　　一起做2024年高考数学真题

　　结果怎样？

　　先说结论：

　　从整体来看

　　大模型们的“高考成绩”

　　都不算太高

　　OpenAI日前发布的

　　新一代旗舰大模型GPT-4o

　　与阿里云研发的通义千问

　　720亿参数大模型Qwen-72b

　　在两次测试中排名都靠前

　　正确率稳定在60%以上

　　部分大模型的表现

　　存在起伏与波动

　　如百川智能、字节跳动新近发布的

　　Baichuan4和豆包大模型

　　分别在新I卷和新II卷客观题测试中

　　得分排名第一

　　但在另一场测试中

　　排名相对靠后

　　图源：复旦大学NLP实验室

　　根据两次评测结果

　　该团队发现

　　大部分测试大模型在简单题

　　（如选择题前三道）

　　有较好的准确率

　　而在中档题中表现一般

　　对于较难的题目

　　大模型们的准确率会更低

　　少部分题目甚至出现

　　“全军覆灭”的情况

　　人工智能这么“聪明”

　　为什么还会出错?

　　AI为什么会把题做错

　　测试发现

　　让AI大模型做数学题

　　仍是一个难度较大的挑战

　　首先

　　文本输入格式的不同

　　会对测试结果造成

　　比较明显的干扰

　　目前测试主要采用

　　上传图片识别文本的方式

　　这种方式更类似“人类”

　　是对大模型能力的全面考验

　　有的大模型还未做题

　　就先败在了AI识图这一步

　　其次

　　大模型的推理能力

　　仍有很大进步空间

　　较难的题目

　　对思维能力的考察要求更高

　　大模型的准确率也会更低

　　此外

　　在多选题方面

　　大多数模型表现不佳

　　可见，面临复杂选项的时候

　　大模型的准确率也会降低

　　虽然在解题方面

　　AI大模型的短期表现

　　还达不到完美

　　但在攻克数学问题的路上

　　AI的每一次进步

　　都是对未来教育想象空间的开拓

　　值得更多耐心与期待

　　撰文/排版：李汶键编辑：李飞统筹：李政葳

　　参考丨复旦大学NLP实验室、澎湃新闻、机器之心、量子位

[ 责编：曾震宇 ]

阅读剩余全文（）

相关阅读

您此时的心情

光明云投

新闻表情排行日/周

开心

0
难过

0
点赞

0
飘过

0

视觉焦点

2025中医医院传承创新发展大会在北京开幕
“玉见文明：良渚文化特展”亮相上海

最热文章

独家策划

推荐阅读

征稿启事 | 2025年度“金镜头”新闻摄影作品评选

2025-12-02 16:53

“镇馆之宝”被做成蛋糕？文物复刻甜品师深情流泪：舍不得做旧！

民族文化宫里珍宝千千万，但说到“镇馆之宝”，首先想到的便是1300多年前文成公主带到西藏的长鼓，许多观众慕名而来只为一睹它的“芳容”。

2025-11-28 13:02

以光影铭记辉煌，首届新疆国际摄影大赛正式启动

为庆祝新疆维吾尔自治区成立70周年，“异元汽车杯”首届新疆国际摄影大赛9月28日正式启动。

2025-09-29 14:31

杜鹃花海茶飘香

2025年4月10日，安徽省芜湖市无为市昆山镇三公山茶叶种植基地，千亩高山野生杜鹃在翠绿的茶园之间绚丽绽放，美轮美奂，美不胜收

2025-04-10 15:13

慕田峪长城山花烂漫

2025年4月1日，北京怀柔慕田峪长城内外山花盛开，美丽的春花把古长城打扮的多姿多娇，犹如春天里一幅壮美的风景画

2025-04-02 15:44