学而思联合谷歌、暨南大学举办2024全球大模型数学推理竞赛

时间：2023-10-12浏览：965

据AAAI（国际先进AI协会）官网，由学而思牵头，联合谷歌、暨南大学等多家科技企业、高校的专家和学者，将共同举办AAAI2024全球大模型数学推理竞赛。

该比赛分为中文数学解题、英文数学解题两个方向，由学而思提供比赛所用的中英文数据集TAL-SAQ7K-CN、TAL-SAQ6K-EN。据称，该数据集囊括了国内外多个中小学数学竞赛真题。

这次竞赛也将是全球首次数学大模型解题竞赛，主办方提供了3个作为参考的测评基准：GPT-3.5、GPT-4、好未来自研数学大模型MathGPT。

在比赛期间，参赛者需使用大模型对给定的数学题目生成推理步骤、答案，主办方将通过对比参赛模型输出答案与正确答案之间的准确率，来进行排名。主办方表示，希望在本次竞赛中要求参赛者使用大语言模型来解决K-12数学问题。（K-12代指学前教育至高中教育，普遍用来代指基础教育。在美国教育体系中，指的是从幼儿园到12年级期间的驾驭阶段）

据介绍，当前大语言模型具备缺乏复杂推理能力、数值计算不准确等“先天缺陷”。若大模型能够克服它们，成功应对数学推理的挑战时，AI将进入一个“崭新时代”。

此次比赛日程如下：

2023年10月10日：开始

2023年12月31日：最终提交截止日期

2024年1月10日：公布最终比赛结果

奖项如下：

两个方向的前三名将获得现金奖励：一等奖1000美元，二等奖600美元，三等奖300美元。

两个方向的前三名将获得正式证书，并受邀在2024年AAAI（国际先进AI协会）的大会期间作口头报告。

前三名团队第一作者将受邀撰写竞赛综述论文。

所有文章未经授权禁止转载、摘编、复制或建立镜像，违规转载法律必究。

举报邮箱：3031084316@qq.com

相关标签： 2024大模型数学推理竞赛