从“会解题”迈向“能出题”:我国发布奥数几何提出与解答系统实现关键突破

奥林匹克数学竞赛中的平面几何问题长期被视为人工智能自动化推理的"最后堡垒"。

这类问题因其独特的数值精度与空间直觉相结合的特点,对机器的逻辑思维和空间想象能力提出了极高要求。

国际上,美国DeepMind公司在2024年初推出的AlphaGeometry系统虽然在解题能力上取得进展,但主要依赖大规模离线合成数据和昂贵的计算资源。

相比之下,我国科研团队自主研发的"通矩模型"系统展现出更具原创性的技术路线,不仅能够高效解题,更具备从无到有创造具有数学审美价值题目的能力。

几何推理之所以困难,根本上源于两大核心挑战。

其一是"组合爆炸"问题。

几何证明往往需要添加精妙的辅助线,每增加一个点或圆,搜索空间都会呈指数级增长,导致计算复杂度急剧上升。

其二是"高质量数据匮乏"。

现有几何题目库规模有限,难以支撑大规模模型的有效训练。

这两个问题长期制约了人工智能在该领域的突破。

"通矩模型"系统的技术核心在于一套创新的神经符号引导树搜索架构。

这一架构使人工智能系统能够像数学家一样,在逻辑树的每个节点上进行系统性探索。

为解决几何证明中的"路径爆炸"难题,研究团队创新性引入了"规范化表示"技术。

这套机制赋予系统一种"识破伪装"的能力:在复杂的几何空间中,同一命题往往因图形的旋转、翻转或缩放而产生无数种表现形式。

系统能够自动识别并合并这些对称或同构的拓扑结构,将庞杂的搜索空间压缩数个数量级,从而大幅提升推理效率。

在寻找解题"灵感"的过程中,系统通过价值函数来模拟人类的数学审美。

借助强化学习技术,系统内置的"价值模型"能实时预判每条推理路径的潜力,不仅判断结论是否成立,更关注推导过程是否简洁优美。

当系统发现某个命题的证明难度显著高于其构建复杂度时,便捕捉到了"直觉性的灵感"。

这种"价值引导"机制使系统能在海量数据中精准筛选出具备奥赛水准的"优雅好题",实现了从机械计算向智能创造的跨越。

此次成果由北京通用人工智能研究院主导,集结了北京大学心理与认知科学学院、智能学院、人工智能研究院以及武汉人工智能研究院等多个顶尖院系的科研力量。

这充分体现了我国在通用人工智能基础研究领域"学-研-产"深度融合的发展优势。

系统在性能上对标并超越了国际顶尖水平,更在功能多样性和运算效率上实现了质的飞跃,标志着我国科研团队在自动化推理和具身智能的逻辑核心领域实现了关键技术的自研自控。

从解题到出题的跨越,标志着我国人工智能研究正从技术跟跑向创新引领转变。

这项突破不仅攻克了困扰学界多年的技术难题,更开辟了机器智能与人类创造性思维融合的新路径。

在科技自立自强的国家战略指引下,此类原创性成果的持续涌现,必将为我国在新一轮科技革命中赢得战略主动提供坚实支撑。