上海发布万亿参数科学大模型 开源开放推动科研范式革新

问题:科学研究对通用化与专业化能力提出更高要求 当前,科学研究加速迈向数据密集、计算密集的新阶段。

传统科研工具在跨学科知识整合、复杂系统建模、海量文献与实验数据筛选等方面效率受限,导致“问题定义难、路径选择难、验证周期长”的矛盾更加凸显。

与此同时,面向科学领域的通用模型往往存在两类短板:一是对物理世界规律的表达不够充分,容易停留在文本层面的表面关联;二是专业能力扩展成本高,难以在多学科、多任务之间实现稳定迁移与持续学习。

如何让模型既具备通用推理能力,又能在关键学科形成可持续的专业化能力,成为推动科研工具升级的核心命题。

原因:以深度专业化通用模型为路径,关键在“密集反馈、主动探索、物理约束” 上海人工智能实验室主任、首席科学家周伯文表示,面向更高层次智能形态的发展,可深度专业化的通用模型是一条可行路径,其挑战集中体现在三方面:其一,专家化能力训练需要低成本、可规模化的密集反馈机制,以支撑在专业问题上的可靠收敛;其二,模型要具备持续学习与主动探索能力,能够针对同一科学问题给出多视角、备选方案并形成可验证的推理链条;其三,需要引入对物理世界规律的系统考量,在多种差异化能力之间兼顾训练效率与性能稳定。

在上述判断下,研究团队围绕底层架构与超大规模训练两条主线推进创新:一方面,重构时序与位置表征方式,引入傅里叶位置编码并改造时序编码器,使模型在理解科学信号时兼具“局部相对关系”和“整体频率规律”的双重视角;另一方面,针对超大规模训练中常见的效率与资源浪费问题,改进内部路由机制,通过稠密估计提升训练稳定性与学习充分性,并以分组路由实现类似“负载均衡”的资源调度,减少闲置与拥塞,提升大规模训练的可行性。

影响:能力从单点突破转向全谱系覆盖,应用从“解题”延伸至真实科研流程 据介绍,基于架构创新与万亿参数训练策略,该科学大模型在数学与物理等权威评测中取得突出表现:在国际数学奥林匹克相关基准与国际物理奥林匹克相关基准测试中展现竞赛级能力,体现了其推理、演绎与多步求解的综合水平。

更值得关注的是,其能力建设并未止步于竞赛式“标准答案”,而是面向“科研任务链”推进。

模型构建了覆盖化学、材料、生命、地球、物理等五大核心学科的能力矩阵,包含100多个专业子任务,在综合学科高难度评测中达到同类领先水平。

随着理解与推理能力增强,模型应用范围从微观层面的化学逆合成路径推断、蛋白质序列生成,拓展到宏观尺度的遥感图像解译等复杂任务,显示出向真实科研场景渗透的趋势。

科研人员认为,这意味着模型正在从“会做题”迈向“能协助解决问题”,有望在提出假设、生成候选方案、筛选实验路径等环节发挥更直接的生产力价值。

对策:以开源开放降低门槛,以“算力—算法”一体化夯实自主可控能力 此次发布强调开源开放导向。

开源不仅有助于降低科研机构、中小团队获取前沿工具的成本,也有利于推动学术界与产业界形成共建共享的生态,加速方法迭代、评测对齐与应用落地。

在科学研究中,方法透明、可复现与可验证尤为重要,开源有望促进数据处理流程、模型推理链条和实验复核机制的完善,提升科研协同效率。

同时,发布信息显示,该模型验证了从原创模型架构到国产算力基座支撑的完整技术链路。

业内人士指出,科学大模型训练与推理对算力供给、通信效率、工程稳定性要求更高,单纯依赖外部软硬件生态容易形成“卡点”。

通过在路由机制、训练策略与算力调度等方面协同优化,有助于构建更加稳健的“算力—算法”一体化底座,为后续更大规模、更复杂任务的模型迭代提供支撑。

前景:从工具升级走向范式变革,关键在场景牵引与治理并重 多方观点认为,面向科学发现的模型发展正处在从能力展示走向系统应用的关键期。

下一步能否形成更大价值,取决于三项因素:一是以重大科研需求牵引应用闭环,在材料设计、药物研发、极端天气与灾害监测、能源系统优化等场景中,建立“模型建议—实验验证—反馈再训练”的循环机制;二是加强高质量科学数据与评测体系建设,推动跨机构的标准化与可复现实践,避免“数据孤岛”与评测割裂;三是同步完善安全与伦理治理框架,明确数据合规、知识产权、科研责任边界与可追溯机制,确保技术扩展与科研规范同向而行。

这场由东方发起的科研智能革命,不仅重新定义了人工智能与科学探索的互动关系,更展现了中国科技界在基础研究领域的创新自信。

当万亿级参数模型开始"思考"科学问题,人类认知世界的维度正在被智能计算重新丈量,这既是技术进步的里程碑,更是文明演进的新起点。