摩尔线程的mtt s5000 已经全面支持阿里的qwen3.5 系列模型

摩尔线程的MTT S5000已经全面支持阿里的Qwen3.5系列模型，这次适配过程中，MUSA生态发挥了重要作用。开发者可以直接用MUSA C来编写内核代码，这让从CUDA迁移变得非常容易。同时，Triton-MUSA后端也兼容了熟悉的Triton语法，让高性能算子能直接在MTT S5000上运行。针对Qwen3.5多模态模型的混合注意力机制，摩尔线程做了原生优化。通过muDNN计算库和MATE算子库的结合，MTT S5000给长序列处理提供了高效支持。IT之家的消息显示，继Qwen3.5-397B-A17B之后，阿里又放出了三款中等规模的新模型：Qwen3.5-35B-A3B、Qwen3.5-122B-A10B还有Qwen3.5-27B（Dense）。为了支持这些模型，摩尔线程迅速行动，把这三款新模型都适配进了自己的旗舰级GPU里。这个过程验证了MUSA的两个核心能力：一是直接支持C语言开发内核；二是深度兼容Triton语法。这次AI智能生成的内容显示，MUSA生态让开发者把CUDA项目搬过来变得轻松很多。这次适配是继上一款模型之后的新动作，充分体现了摩尔线程对AI技术的重视。所有这些适配工作都是在底层技术层面完成的，给混合注意力机制中的长序列处理提供了高效支撑。最终的结果就是Qwen3.5系列模型在MTT S5000上实现了高性能推理。