网站首页
手机版

美国高考(ACT)数学试题让国内一众AI大模型全军覆灭

更新时间:作者:小小条

美国高考(ACT)数学试题让国内一众AI大模型全军覆灭

美国高考(ACT)数学试题让国内一众AI大模型全军覆灭

一、美国高考简介

美国高考是分层次的,既有高中水平层次的,也有大学水平层次的考试。美国高考主要包括SAT(学术能力评估测试)、SAT 项目测试(原称 SAT II)、ACT(美国大学入学考试)、CLT(经典学*测试)、AP 测试(大学水平课程测试)、托福 (英语作为外语测试)以及GED (普通教育发展)。

主要的大学入学考试是SAT和ACT,而CLT是另一种较新的选择,被少数学校接受。另外还有AP 测试(美名校标配)。

(一)SAT

SAT 有两个主要部分。第一个部分叫做基于证据的阅读和写作,它包括两个测试:阅读测试和写作与语言测试。SAT的第二部分是数学测试,分为两个部分:带计算器的数学测试和不带计算器的数学测试。SAT考试时长为三个小时,不包括休息时间,还有一个可选的50分钟作文。阅读测试和写作与语言测试之间有10分钟的休息时间,数学测试的两部分之间有5分钟的休息时间。

SAT 项目测试(原称 SAT II)是一系列专注于个别科目的大学入学考试。这些考试可以提升你的入学资质。并非所有学校都要求或考虑这些SAT 学科考试。有20种SAT学科考试,这些考试基于高中课程,涵盖历史、英语、外语、科学和数学等领域。

(二)ACT

ACT考试包括四个选择题部分——英语、数学、阅读和科学——还有一个可选的写作部分。一些学院和大学要求或接受ACT写作成绩,所以你可以考虑参加写作部分。

1.数学部分

数学部分报告九个分数:一个是整体部分的分数,另外八个是基于特定数学知识和技能的报告类别分数。每个报告类别所占的百分比大约是:

为高阶数学做准备 (57–60%):这个类别涵盖了学生最近学*的数学,从学生开始将代数作为表达和解决方程的一般方法时开始。这个类别分为五个子类别。

数字与数量 (7–10%):展示对实数和复数系统的理解。学生将理解并能够处理以多种形式表示的数值量,包括整数和有理数指数,以及向量和矩阵。

代数 (12–15%):解决、图形化和建模多种类型的表达式。学生将使用许多不同类型的方程,包括但不限于线性、多项式、根式和指数关系。学生将找到方程组的解,即使它们以简单的矩阵形式表示,并将他们的知识应用于实际应用中。

功能 (12–15%):这一类别的问题测试对函数定义、符号、表示和应用的知识。问题可能包括但不限于线性、根式、分段、多项式和对数函数。学生将对函数进行操作和翻译,并找到和应用图形的重要特征。

几何 (12–15%):定义并应用形状和固体的知识,例如全等和相似关系或表面积和体积测量。理解物体的组合,并求解三角形、圆和其他图形中缺失的值,包括使用三角比和圆锥曲线方程。

统计与概率 (8–12%):描述分布的中心和离散程度,应用和分析数据收集方法,理解并模型双变量数据中的关系,并计算概率,包括相关的样本空间。

整合基本技能(40-43%):这个类别重点测量你综合运用理解和技能解决更复杂问题的能力。问题要求你解决诸如速率和百分比;比例关系;面积、表面积和体积;平均数和中位数;以及以不同方式表示数字等概念。解决涉及链式步骤中结合技能的非常规问题;在不同背景下应用技能;理解联系;以及展示熟练程度的问题。

建模:这个类别代表所有涉及建立、解释、理解、评估和改进模型的问题。每个问题也会被计入上面其他适当的报告类别。这个类别是对你在数学主题中使用建模技巧的总体衡量。

注:所有数学问题都可以不用计算器解决。许多问题最好不用计算器。在决定是否使用计算器时,请使用良好的判断力。例如,对于某些问题,您可能希望先进行草稿计算,以澄清您对问题的看法,然后再使用计算器进行计算。

2.科学部分

科学部分测试在自然科学中所需的解释、分析、评估、推理和解决问题的能力。该部分呈现几个真实的科学场景,每个场景后跟随一些多项选择题。

内容包括生物学、化学、地球/空间科学(例如地质学、天文学和气象学)和物理学。科学部分重点是多维度评估,问题旨在评估科学内容、科学技能和科学实践的结合。

(三)AP测试(大学预修课程测试)

国人都知道“美国高考叫‘SAT’”,其实大部分国人不知道美国还有SAT II以及ACT考试——它们理科部分相当于中国高考的理科卷,除此之外还有AP微积分考试、AP统计学考试、AP化学考试、AP宏观经济学考试、AP微观经济学考试、AP物理学考试、A P计算机考试等大学级别的全球几百万高中精英生(荣誉生)参加的一年一次的考试。

许多高中提供AP(大学预修课程)。AP课程的内容必须经过College Board®的批准,College Board®也是管理SAT和SAT学科考试的同一个组织。AP考试是在五月每个AP课程结束时进行的标准化考试,用于衡量对课程内容和技能的掌握程度。得分范围是1到5。3、4或5的分数有可能获得大学学分。

大多数AP考试的时长为2到3小时。38门考试有所不同,尽管考试的第一部分通常由选择题组成,第二部分由自由回答题组成。

虽然AP成绩通常不被视为大学入学考试,但如果获得了高分,将其包含在大学申请中也是明智的。如果你的AP成绩符合大学获得大学学分的指南,你将需要确保将你的成绩发送到你最终选择上的大学。

二、美国高考(ACT)数学试题

下面是一条来源于https://magoosh.com/act/的ACT数学试题:

x、y都是实数,且满足(x-6)^2+(y-4)^2 ≤100。当x≥0、y≥0时,则满足(x-6)^2+(y-4)^2 ≤100的所有点(x,y)落在特定的区域内,求该区域的面积是多少?

该题的解答见图1、图2:

图 1

图 2

三、测试结果全军覆灭

笔者在昨晚在手机端对国内一众AI大模型就上述美国高考(ACT)数学试题进行测试。参与测试的有Manus、科大讯飞、通义千问、Kimi、DeepSeek 、豆包、腾讯元宝、文小言以及OIOI。结果大跌眼镜,参与测试的均惨败。

笔者留意到,似乎有个别的AI大模型给出的估值大约在193上下,比如:DeepSeeK给出三个完全对不上的值——一个约193.46、一个约150.79(按其精确表达式计算)以及一个约266.16(按其另一个精确表达式计算),估且且将193.46作为答案吧;文小言答案为193.2;腾讯元宝答案为193.13;通义千问约188.99。——它们答案接近193上下,但仍然不是正确答案,无论是精确表达式还是估算值。

至于其他AI大模型就错得更离谱了。

至于估值大约在193上下或与该值相当的精确表达式也错,主要错在积分区间:x∈[0,6+√84]。从下图3可见它们积分时基本少计了直线p右侧的一小块区域,如果把它补上就跟我的答案是一致的,无论是精确表达式还是估算值(注:为了让读者易懂,不采用微积分方法,只是采用高中数学方法来求解)。

图 3

综上所述,Manus、科大讯飞、通义千问、Kimi、DeepSeek 、豆包、腾讯元宝、文小言以及OIOI均以失败告终。

(一)Manus

图 4

图 5

(二)科大讯飞

图 6

图 7

(三)通义千问

图 8

图 9

(四)Kimi

图 10

图 11

(五)DeepSeek

图 12

图 13

(六) 豆包

图 14

图 15

(七) 腾讯元宝

图 16

图 17

图 18

(八) 文小言

图 19

图 20

(九) OIOI

图 21

图 22

版权声明:本文转载于今日头条,版权归作者所有,如果侵权,请联系本站编辑删除

为您推荐

甘肃2025年高考高职专科批次录取结果什么时候出?附录取查询入口

小伙伴们晚上好呀这两天高考高职专科批次开始填志愿啦有的考生想了解录取结果什么时候出?录取查询入口在哪里?兰宝都给大家整理好啦↓↓↓ 01 2025甘肃高考录取时间 本

2025-12-27 06:08

美术生考大学容易吗

很多人觉得美术生考大学容易,其实不然,美术高考包括专业考试和文化课考试,想考好大学并不容易。美术生很累的,付出的比文化课的学生多得多,其中的辛酸只有美术 生自己知道。 大

2025-12-27 06:08

高考美术特长生考什么 美术特长生怎样准备高考

一、高考美术特长生考试内容 1、 文化考试的话和文化生一样都要考。美术统考是素描、水粉或水彩其一。学校校考的画可能是上面三个全考或选其一二还有学校会考的设计。 高考

2025-12-27 06:07

从一则招生广告说起(3)——查该校未经呈准即已登报招生开学

兴办学校需要钱,钱从何而来呢?一份1943年7月176师公墓筹建委员会筹设景忠中学经费收支总表给出了答案:科目 实收款 科目 实付款苏军长祖馨2000 学校建筑材料 7000杨参谋长赞谟

2025-12-27 06:07

清华学神:20门课程15门满分,4门99分,毕业于安庆一中

在没有参加高考之前,如果清华大学给予保送资格,你是接受还是任性得继续参加高考?估计很多人选择的是接受保送。但是在2011年的时候,在安徽就有一位考生放弃了保送清华大学资格,而

2025-12-27 06:06

已经确定!今晚7:00,发布吉林省高考成绩

据吉林省教育考试院最新发布消息,2019年吉林省普通高校招生考试成绩,预计于6月22日晚19:00发布。 成绩查询方式(直接点击网址进入网站)1、登录吉林省教育考试院(http://www.jle

2025-12-27 06:06