全球人工智能竞争正进入关键阶段,大模型训练的效率与成本控制,已成为制约行业前进的主要瓶颈。自2015年ResNet提出残差连接以来,此结构推动了深度学习快速演进,但其“无差别叠加”的信息传递方式,容易在深层网络中造成信息被稀释、训练不稳定等问题。随着参数规模指数级增长,这一路线的局限越来越明显。
技术创新的价值往往不在最显眼的应用,而在支撑一切的基础架构;Kimi团队对残差连接的改造,就是一次从底层入手的尝试。当全球AI竞争从应用比拼逐步转向基础理论与架构能力的较量,中国研究团队在该关键环节取得进展,不仅反映了技术积累的提升,也为中国在人工智能长期竞争中的位置增添了新的支点。这类创新,正在从更细微的底层机制上改变全球AI格局。