我国人工智能领域取得重大突破 阿里巴巴发布新一代开源大模型

(问题)当前,通用大模型加速进入产业化深水区,企业用户更关注三项核心指标:一是能力能否稳定覆盖推理、编程与复杂任务;二是部署与推理成本是否能明显下降;三是是否具备跨文本、图像、视频等多模态理解能力,以支撑办公、工业、消费等场景落地。全球竞争加剧的背景下,开源生态的“可用性”和“可负担性”正在影响技术扩散速度。 (原因)在这个需求牵引下,阿里巴巴于2月16日除夕当天开源千问Qwen3.5-Plus,并公布其在能力、效率与价格上的升级。该模型总参数规模为3970亿,但推理时激活参数仅170亿,主打以更低算力实现更强效果。千问团队对底层架构进行了调整,将线性注意力机制与稀疏混合专家等方案结合,并引入自研门控等关键技术,控制计算开销的同时提升有效参数利用率。训练侧通过稳定性优化、多token预测等技术路线,提高训练与推理的综合效率,为后续大规模应用提供更可持续的成本曲线。 (影响)从性能表现看,Qwen3.5-Plus定位为开源体系中的高性能版本,在推理、编程、智能体等多类基准测试中保持较强竞争力。更受关注的是效率指标:部署显存占用降低约60%,在常见32K上下文场景下推理吞吐量提升明显;在256K长上下文条件下,最大推理吞吐量可提升至19倍。这意味着在长文档分析、代码仓库理解、复杂检索增强等场景中,单位算力可承载的并发能力更强。价格上,该模型接口价格最低可至每百万token 0.8元,为企业大规模调用提供更可控的预算空间,推动大模型从“可试用”走向“可规模化生产”。 (对策)能力形态上,千问3.5实现从纯文本到原生多模态的升级。与此前以纯文本token预训练不同,新版本基于视觉与文本混合token进行预训练,并扩充中英文、多语种、理工科及推理类数据供给,使模型在视觉理解与逻辑推理上形成更强耦合能力。官方披露,其在多模态推理、通用视觉问答、文本识别与文档理解、空间指代、视频理解等评测中取得领先成绩。训练基础设施上,对应的多模态训练在云端算力平台上完成,通过吞吐优化使混合数据训练效率接近纯文本训练,同时采用更精细的低精度与高精度混合策略,在超大规模token训练阶段降低激活内存占用并提升训练速度,从工程层面降低多模态训练门槛。应用侧,基于更强的视觉与操作能力,千问3.5深入向“可执行”智能体迈进,支持对手机与电脑进行多步骤操作,覆盖更多移动端应用指令与桌面端跨应用流程,有助于在办公自动化、信息整理、运维辅助等场景加快验证。 (前景)业内观察认为,国内大模型近期密集更新,竞争焦点正从“参数规模”转向“能力—效率—成本—生态”的综合比拼。除夕发布的开源动作与价格策略,意在扩大开发者与企业用户覆盖面,加速工具链与应用层生态建设。随着更高规格的旗舰模型后续推出,围绕长上下文、多模态理解、智能体执行与安全合规的系统工程,将成为下一阶段技术与产业竞争的关键。同时,大模型进入千行百业仍需解决数据治理、隐私保护、行业评测标准与落地责任边界等问题。只有在规范框架下推进开放与创新,才能更充分释放生产力增量。

千问3.5的发布表明了国产大模型在架构设计与工程优化上的持续进展;从架构与训练效率到长上下文与多模态能力,再到更具可用性的成本结构,该模型在多个维度提升了开源大模型的产业化可行性。下一步,如何把技术优势转化为可复制的应用价值,并推动AI在行业场景中稳定落地,将成为产业发展的重要课题。