摩尔线程的MTT S5000已经全面支持阿里的Qwen3.5系列模型,这次适配过程中,MUSA生态发挥了重要作用。开发者可以直接用MUSA C来编写内核代码,这让从CUDA迁移变得非常容易。同时,Triton-MUSA后端也兼容了熟悉的Triton语法,让高性能算子能直接在MTT S5000上运行。 针对Qwen3.5多模态模型的混合注意力机制,摩尔线程做了原生优化。通过muDNN计算库和MATE算子库的结合,MTT S5000给长序列处理提供了高效支持。IT之家的消息显示,继Qwen3.5-397B-A17B之后,阿里又放出了三款中等规模的新模型:Qwen3.5-35B-A3B、Qwen3.5-122B-A10B还有Qwen3.5-27B(Dense)。 为了支持这些模型,摩尔线程迅速行动,把这三款新模型都适配进了自己的旗舰级GPU里。这个过程验证了MUSA的两个核心能力:一是直接支持C语言开发内核;二是深度兼容Triton语法。 这次AI智能生成的内容显示,MUSA生态让开发者把CUDA项目搬过来变得轻松很多。这次适配是继上一款模型之后的新动作,充分体现了摩尔线程对AI技术的重视。 所有这些适配工作都是在底层技术层面完成的,给混合注意力机制中的长序列处理提供了高效支撑。最终的结果就是Qwen3.5系列模型在MTT S5000上实现了高性能推理。