阿里巴巴开源发布千问Qwen3.5-Plus:原生多模态升级驱动高性能与低成本双突破

在人工智能技术快速发展的背景下,如何提升模型性能同时降低计算成本成为行业共同课题。

此次发布的新一代开源模型,通过创新性的混合架构设计,有效解决了这一难题。

技术突破主要体现在三个方面:一是采用线性注意力机制与稀疏混合专家架构,在保持3970亿总参数规模的同时,将激活参数控制在170亿,大幅提升计算效率;二是通过多token预测等创新技术,使模型在32K上下文场景中的推理吞吐量提升8.6倍,256K超长上下文情况下最大提升19倍;三是优化训练稳定性,使得多模态训练吞吐量接近纯文本模型水平。

性能测试数据显示,该模型在MMLU-Pro知识推理评测中得分87.8,在博士级难题GPQA测评中获得88.4分,在指令遵循IFBench测试中以76.5分刷新纪录。

在多模态能力方面,模型支持长达2小时的视频输入分析,并能将手绘草图直接转换为可用前端代码。

成本控制方面,该模型API价格降至每百万Token0.8元,仅为国际主流产品的1/18。

显存占用降低60%,显著提升了部署经济性。

这些突破得益于企业持续的基础设施投入和技术创新,包括自研门控技术、训练优化方案等。

业内专家指出,此次技术突破标志着我国在人工智能基础模型领域取得重要进展。

该模型的开源策略将促进技术共享,推动行业整体发展。

未来,随着多模态能力的持续增强,这类技术有望在教育、医疗、工业等领域创造更大价值。

千问3.5的发布反映了国内开源大模型在技术创新和产业应用上的持续进步。

通过架构创新、多模态融合和成本优化的有机结合,该模型在国际竞争中展现了中国AI产业的技术实力。

随着开源模型性能与成本的不断优化,大模型技术将更加贴近实际应用需求,有助于推动人工智能在各行业的深度融合与创新发展。