打破“残差连接”十年惯例、重做架构设计：Kimi发布注意力残差引发国际业界关注

全球人工智能技术竞争日趋激烈，深度学习模型的训练效率和成本问题正成为行业发展的主要瓶颈。自2015年ResNet论文发表以来，基于残差连接的神经网络架构虽被广泛应用，但其核心设计一直未有重大突破。传统残差连接的"无差别叠加"机制导致深层网络训练中出现信息重要性失衡、计算资源浪费等问题。

大模型发展正从追求规模转向注重结构和效率的新阶段。对残差连接等基础组件的重新思考，反映了技术竞争正向底层架构延伸。能否持续产出原创成果并实现工程化应用，将决定我国在新一轮人工智能发展中的竞争力。