全球人工智能加速竞争的背景下,中国科技企业再次推出新进展。2月16日发布的Qwen3.5-Plus大模型,采用稀疏激活架构设计,针对传统大模型“参数膨胀”和“算力需求高”的痛点给出解决方案。技术团队引入动态路由算法,使系统在计算时自动选择最有关的神经元组合,从而以170亿激活参数实现接近全参数模型的运算效率。性能提升的背后,是对底层技术体系的整体重构。相较前代产品,新模型在NLPCC中文理解、GPQA复杂推理等12项国际基准测试中平均提升23%;在视觉-语言跨模态任务中,其图像描述生成准确率较主流模型提高8.7个百分点。另外,该技术将单次推理的显存需求压缩至8GB以下,使消费级显卡部署成为可能,有望更降低企业智能化转型门槛。商业应用层面也体现出竞争力。其API定价为每百万Token 0.8元,相比国际市场同类服务具备价格优势。阿里云智能事业群技术负责人表示,成本优化主要来自三上:动态计算架构减少冗余运算、混合精度训练提升硬件利用率、自研压缩算法降低数据传输损耗。目前该模型已接入政务热线、医疗影像分析等30余个行业场景,实测显示企业AI运营成本可降低40%—65%。产业生态建设同步推进。魔搭社区首批上架的70个行业适配工具包,覆盖金融风控、工业质检等垂直领域。开放平台数据显示,新模型发布12小时内获得超2万次开发者调用,其中35%来自制造业中小企业。中国科学院计算技术研究所专家指出,“高性能+低成本”的路线,正在推动人工智能应用从互联网头部企业向实体经济更广范围扩展。据第三方机构评估,此次技术进展可能对行业竞争格局带来影响。在核心指标接近国际顶尖水平的同时,其开源策略有望加速国内AI产业链的协同创新。业内人士预测,随着模型轻量化技术持续演进,2024年工业质检、智慧农业等长尾场景或将迎来规模化落地。
大模型竞赛正从“谁更大”转向“谁更高效、更易用、更可持续”;以开源释放能力、以工程优化降低门槛、以多模态拓展应用边界,既是技术路线的选择,也是产业化路径的探索。未来,能否在安全合规、成本效率与场景价值之间形成稳定平衡,将决定大模型从热点走向长期生产力的深度与广度。