跳动百科

563支AI队伍和姜萍答了同一份试卷 AI挑战人类智慧边界

步群旭
导读 6月13日,第六届阿里巴巴全球数学竞赛揭晓决赛名单,亮点之一是17岁的姜萍,来自江苏涟水中等专业学校,她不仅排名12位,更是全球30强中唯...

6月13日,第六届阿里巴巴全球数学竞赛揭晓决赛名单,亮点之一是17岁的姜萍,来自江苏涟水中等专业学校,她不仅排名12位,更是全球30强中唯一的女性选手。这次比赛因姜萍的出色表现而备受瞩目,同时也让阿里数赛本身得到了更广泛的关注。与以往不同,本届赛事新增了AI大模型挑战赛,吸引了563支由顶尖高校、研究机构及企业组成的AI团队与人类选手同台竞技,尽管如此,在最终的801名决赛入围者中,没有AI队伍能够晋级。

据统计,参与的AI队伍平均得分达到18分,接近人类选手水平,但最高分34分与人类最高分113分相比,显示了显著的差距。其中,由上海建平中学学生涂津豪设计的AI方案获得了AI队伍中的最高分,该方案利用自辩论策略提高解题准确性。而西南交通大学和中国人民大学的两支AI队伍分别以27分的成绩成为亚、季军,它们均采用多智能体系统来优化解题过程。

浙江大学计算机系统结构实验室的研究员陈天楚指出,当前的大语言模型在处理数学竞赛这类需要反复试错和深入思考的任务时,还存在局限性,尤其是在复杂推理和严谨思考方面。尽管可以通过特定方法促使AI自我质询,但这种提升效果有限,尚不能与受过专业训练的人类相提并论。

赛事组委会在点评中强调,AI在逻辑推理和证明题方面的不足尤为明显。一位来自互联网企业的技术总监认为,尽管AI在某些明确规则和计算密集任务上能超越人类,但在深度逻辑推理和创新思维领域,人类依然占据主导。他视此竞赛为推动AI技术发展和深化人类对人工智能理解的契机。

今年的AI挑战赛中,各队伍尝试多种策略以增强AI的数学处理能力,预示着AI与数学结合的探索正不断深入。自2018年创办以来,阿里数赛以其无门槛、全民可参与的特点,吸引了全球25万人次参与,成为全球最大的在线数学竞赛平台,持续激发着数学爱好者的热情与创造力。