我国人工智能领域取得重大突破阿里巴巴发布新一代开源大模型

（问题）当前，通用大模型加速进入产业化深水区，企业用户更关注三项核心指标：一是能力能否稳定覆盖推理、编程与复杂任务；二是部署与推理成本是否能明显下降；三是是否具备跨文本、图像、视频等多模态理解能力，以支撑办公、工业、消费等场景落地。全球竞争加剧的背景下，开源生态的“可用性”和“可负担性”正在影响技术扩散速度。（原因）在这个需求牵引下，阿里巴巴于2月16日除夕当天开源千问Qwen3.5-Plus，并公布其在能力、效率与价格上的升级。该模型总参数规模为3970亿，但推理时激活参数仅170亿，主打以更低算力实现更强效果。千问团队对底层架构进行了调整，将线性注意力机制与稀疏混合专家等方案结合，并引入自研门控等关键技术，控制计算开销的同时提升有效参数利用率。训练侧通过稳定性优化、多token预测等技术路线，提高训练与推理的综合效率，为后续大规模应用提供更可持续的成本曲线。（影响）从性能表现看，Qwen3.5-Plus定位为开源体系中的高性能版本，在推理、编程、智能体等多类基准测试中保持较强竞争力。更受关注的是效率指标：部署显存占用降低约60%，在常见32K上下文场景下推理吞吐量提升明显；在256K长上下文条件下，最大推理吞吐量可提升至19倍。这意味着在长文档分析、代码仓库理解、复杂检索增强等场景中，单位算力可承载的并发能力更强。价格上，该模型接口价格最低可至每百万token 0.8元，为企业大规模调用提供更可控的预算空间，推动大模型从“可试用”走向“可规模化生产”。（对策）能力形态上，千问3.5实现从纯文本到原生多模态的升级。与此前以纯文本token预训练不同，新版本基于视觉与文本混合token进行预训练，并扩充中英文、多语种、理工科及推理类数据供给，使模型在视觉理解与逻辑推理上形成更强耦合能力。官方披露，其在多模态推理、通用视觉问答、文本识别与文档理解、空间指代、视频理解等评测中取得领先成绩。训练基础设施上，对应的多模态训练在云端算力平台上完成，通过吞吐优化使混合数据训练效率接近纯文本训练，同时采用更精细的低精度与高精度混合策略，在超大规模token训练阶段降低激活内存占用并提升训练速度，从工程层面降低多模态训练门槛。应用侧，基于更强的视觉与操作能力，千问3.5深入向“可执行”智能体迈进，支持对手机与电脑进行多步骤操作，覆盖更多移动端应用指令与桌面端跨应用流程，有助于在办公自动化、信息整理、运维辅助等场景加快验证。（前景）业内观察认为，国内大模型近期密集更新，竞争焦点正从“参数规模”转向“能力—效率—成本—生态”的综合比拼。除夕发布的开源动作与价格策略，意在扩大开发者与企业用户覆盖面，加速工具链与应用层生态建设。随着更高规格的旗舰模型后续推出，围绕长上下文、多模态理解、智能体执行与安全合规的系统工程，将成为下一阶段技术与产业竞争的关键。同时，大模型进入千行百业仍需解决数据治理、隐私保护、行业评测标准与落地责任边界等问题。只有在规范框架下推进开放与创新，才能更充分释放生产力增量。

千问3.5的发布表明了国产大模型在架构设计与工程优化上的持续进展；从架构与训练效率到长上下文与多模态能力，再到更具可用性的成本结构，该模型在多个维度提升了开源大模型的产业化可行性。下一步，如何把技术优势转化为可复制的应用价值，并推动AI在行业场景中稳定落地，将成为产业发展的重要课题。

我国人工智能领域取得重大突破 阿里巴巴发布新一代开源大模型

我国人工智能领域取得重大突破阿里巴巴发布新一代开源大模型