奥林匹克数学竞赛被视为人工智能逻辑推理能力的“试金石”。2024年初,DeepMind开发的AlphaGeometry曾引起全球轰动,展示了AI在解题方面的巨大潜力。然而,AlphaGeometry本质上是一个“被动解题者”,其训练极度依赖于大规模的合成数据和昂贵的计算资源。与之相比,我国科研团队自主研发的TongGeometry则展现出了更高维度的智能:它不仅是一个能够满分交卷的“优等生”,更是一位能够创造优美、新颖题目的“出题名师”。
论文第一作者、北京通用人工智能研究院张驰博士介绍:“我们在研究中发现了一个深刻的对偶性:当一个几何命题的证明难度显著高于其构建复杂度时,它便具备了作为奥赛题目的‘审美价值’。通过这种对偶关系的建模,TongGeometry能够从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目。这在国际上首次实现了从‘模仿解题’到‘自主创造’的范式转变。”
在性能表现上,TongGeometry展现了极高的国产原创技术优越性。相比AlphaGeometry需要庞大的算力集群,TongGeometry仅需单张消费级显卡(如RTX 4090)即可在最多38分钟内,解决近25年所有的奥数几何难题,其推理效率和准确率均达到世界顶尖水平。此外,该系统通过创新的“规范化表示”技术,将搜索空间压缩了几个数量级,有效解决了传统方法中的路径爆炸问题。
论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,TongGeometry的意义不仅在于解题速度的提升,更在于它通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能(AGI)发展的关键。“我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。
目前,TongGeometry的原创能力已得到专业学术界和竞赛圈的认可。系统自主生成的3道几何新题,已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛(Ersatz Math Olympiad),这是AI原创题目首次进入高规格人类数学竞赛。
这一成果标志着中国星空体育在线入口科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上全面超越了以DeepMind为代表的国际顶尖水平。该科研团队由北京通用人工智能研究院(BIGAI)、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院,以及北京大学武汉人工智能研究院联合组成,未来将继续深耕“通系星空体育在线入口列”通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
人工智能在食品真实性鉴定中的应用:从标签属性到掺假检测 MDPI Foods
人工智能与多模态生物标志物融合:推动自身免疫性风湿病迈向精准医疗新时代 MDPI Rheumato
FDE Shantanu Tilak:运用人工智能实现协作学习的控制论指南