2024年4个来自布鲁塞尔自由大学的科研人员宣布了一次可能改写AI发展进程的重大突破。他们发现,OpenAI研发的ChatGPT-5.2已经具备了独立生成数学证明的能力。这个消息就好比是一颗投入平静湖面的石子,瞬间激起千层浪。让大家惊讶的是,ChatGPT-5.2(Thinking)把数学家Ran和Teng在2024年提出的一个长期未解难题给破解了。这张作为成果的图片,是由Midjourney的AI服务生成的。 这次的成功意味着大型语言模型(LLMs)的势力范围正式扩大。它们不再只是在代码编写或文本创作上发挥作用,而是触及了需要严密逻辑推理的纯理论数学领域。这种变化带来的震动让数学界意识到,科学研究的游戏规则可能要改写了。研究团队给这种新的研究方式起了个时髦的名字——“氛围证明”,这个词听上去就很像最近流行的“氛围编程”。在整个过程中,ChatGPT自己探索解决问题的路线图,还搭起了核心的逻辑架构,展现了一种超越简单数据拼凑的真正创造性思维。 这个证明涉及到了7轮你来我往的对话互动和4个版本的自我改进,最终形成了滴水不漏的逻辑论证。虽然最后的核查工作还是由人类科学家来做,但AI的计算速度远远超过了大家的预期。VUB的Vincent Ginis教授认为,这次成就打破了人们对AI只能归纳而不能创造的偏见。既然门槛降低了,理论数学的研究速度就会像火箭一样往上涨。 从长远看,人类在科研中的角色也发生了转变,他们从以前的生产者变成了现在的验证者。对于OpenAI这家公司来说,他们的使命是让通用人工智能(AGI)更好地服务全人类。除了ChatGPT系列模型,他们还开发出了像DALL-E这样的知名产品。所谓的数学猜想,就是指基于现有知识提出的、还没被证实或证伪的命题。 大型语言模型(LLM)是用深度学习技术训练出来的、有着大量参数的AI模型。它们能听懂人话也能说人话,现在自然语言处理领域的主流就是用transformer这种架构搭建的LLM。