问题:从“能说会写”到“能证能推”,专业推理能力仍是关键短板 周伯文在报告中提出,当前智能技术已展现出强大的知识覆盖与任务泛化能力,但面对高门槛、强约束、长链条的专业问题时,仍容易出现推理不稳、关键细节遗漏、结论可验证性不足等现象。
特别是在科学研究场景中,问题往往不止是回答已有问题,更涉及提出假设、设计验证路径、总结规律并形成可复现的解释体系,对“慢思考”的逻辑推演、证据链构建和不确定性处理提出更高要求。
原因:发展路径存在阶段跃迁,“通才”与“专家”长期分化 周伯文回顾人工智能发展历程认为,技术演进并非简单叠加,而是呈阶段性跃迁:狭义智能在特定任务上不断逼近上限后,才迎来更具跨域泛化能力的新阶段。
近年来,基于大规模预训练的模型通过算力、数据与架构扩展实现了广泛泛化,其意义在于验证了规模化训练对知识压缩与能力涌现的价值,为更高层级智能奠定基础。
但与此同时,历史上“专业性”与“通用性”往往沿两条路线推进:一类系统深耕单一领域,性能突出却难迁移;另一类系统覆盖广泛,擅长通用任务却在专业深度、验证闭环与严谨性方面存在差距。
科学研究恰恰处在两者交汇处:既需要通用知识整合,又需要可检验的专业推理与持续学习能力。
影响:科学发现成为“终极考场”,也可能暴露工具化依赖风险 报告提出,科学发现不仅承载重大应用价值,也是推理智能的“压力测试”。
其挑战至少体现在三方面:其一,“已知的未知”带来的组合爆炸,在分子设计、材料发现等领域,搜索空间极其庞大,传统穷举不可行;其二,“未知的未知”要求对分布外问题进行创造性泛化,既要敢于提出新假设,也要能自洽地解释;其三,稀疏与延迟反馈是常态,实验周期长、成本高、回报不即时,对学习算法的策略规划与样本效率提出苛刻要求。
在此背景下,尽管科学智能在蛋白质结构预测、气象等方向已取得里程碑进展,但周伯文援引近期学术界讨论指出,若过度依赖既有深度学习范式,可能在一定程度上固化“已知边界”,使探索倾向于在既定数据分布内优化,从而对真正的新知识发现形成约束。
换言之,工具的强大并不天然等同于科学突破的必然,更需要在方法论上实现从“拟合经验”向“可推可证”的跃迁。
对策:以通专融合为路径,构建“快思考+慢思考”的统一智能架构 围绕“通专融合”,周伯文提出可探索的方向是动态结合直觉式的快速判断与逻辑式的深度推理:在保持通用认知基座的同时,让系统能够在特定任务上通过持续学习、可控推理与严谨验证达到专家级水平。
其核心不在于单纯增加算力与参数规模,而在于形成面向复杂现实任务的系统化能力:既能利用大模型的知识与语言优势迅速生成候选思路,又能通过结构化推理、工具调用、实验或仿真闭环来筛选与验证,最终形成可复现、可审计的结论链条。
据介绍,上海人工智能实验室提出的相关技术架构意在弥合“广泛泛化”与“深度专精”之间的鸿沟,探索统一的认知生态体系。
这类尝试的价值在于把科学任务拆解为“提出—验证—总结”的闭环流程,并将推理与学习放到同一系统框架中,让模型在面对新问题时不止于输出答案,更能给出验证路径与不确定性边界。
前景:大规模深度推理有望赋能科学突破,科学探索也将反哺智能进化 周伯文判断,科学发现将成为未来一段时期智能技术的重要增量空间。
一方面,面向科学问题的深度推理可望在新材料、新药研发、能源与气候等领域提升探索效率,推动从“经验驱动”走向“机理驱动+数据驱动”融合;另一方面,科学研究的高不确定性、强约束与长周期反馈,将倒逼智能系统在因果推断、可解释性、鲁棒性与自我纠错能力上实现提升,从而推动推理能力的迭代升级。
同时,推进这一进程仍需关注边界条件:科学问题高度复杂,数据质量、实验可重复性、评测体系与安全合规都将影响技术落地。
未来亟需在开放协作、标准化评测、可信验证与跨学科人才培养等方面形成合力,使技术进步更好服务科学研究与产业创新。
人工智能的发展已进入深水区,简单的规模扩张和单一能力的优化已难以满足时代需求。
通专融合不仅是技术层面的创新,更是对AI发展哲学的深刻反思。
只有打破通用与专业的对立,构建既具广度又具深度的智能体系,才能真正推动人工智能向通用阶段迈进。
而以科学发现为试验场,在推理能力的锻造中实现AI的突破,这条路径既充满挑战,也充满机遇。
这将是未来人工智能发展的重要方向。