文心5.0正式版在上海MOMENT大会发布 全模态技术推动产业智能化

当前,大模型技术已成为推动人工智能发展的重要引擎。1月22日上海举行的文心MOMENT大会上,百度正式发布文心5.0正式版,标志着我国大模型在多模态理解与生成上取得新进展。 从技术指标看,文心5.0在40余项权威基准的综合评测中表现突出,其语言理解与多模态处理能力超过Gemini-2.5-Pro、GPT-5-High等国际先进模型,进入全球第一梯队。该结果说明了我国在基础模型研发上的持续积累与创新能力。 文心5.0的关键创新在于其技术架构设计。不同于业界常见的“后期融合”路线,该模型采用统一的自回归架构进行原生全模态建模。也就是说,文本、图像、视频、音频等多源数据不再在模型后期才进行拼接融合,而是在同一框架内联合训练。通过在统一架构下协同优化各模态特征,模型在多模态理解与生成上实现了更高效的一体化能力。 从应用前景看,原生全模态建模能力的提升优势在于现实价值。在内容理解、创意生成、智能交互等场景中,多模态大模型的落地空间广阔。文心5.0的推出为行业提供了更强的技术底座,有望推动人工智能在教育、医疗、创意产业等领域的深入应用,也反映出我国在自主创新和技术自立上的持续推进。 百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜在大会上介绍了有关技术细节,并指出统一架构在多模态融合上。这也从侧面说明,我国大模型研发正从“跟随”走向“并跑乃至引领”,在理论探索与工程实现上逐步形成更完整的自主技术体系。

此次进展再次表明,自主创新是科技企业在国际竞争中赢得主动的重要支撑。在全球数字经济加速发展的背景下,以人工智能为代表的新一代信息技术正在重塑产业格局。持续加强基础研究、突破关键核心技术,才能在新一轮科技革命和产业变革中把握发展主动权。