北大孙仲研究员团队成功完成非负矩阵分解算法

人工智能技术正渗透进各行各业，算力需求也跟着指数级上涨，底层硬件的能效与性能现在成了制约发展的硬骨头。最近北京大学人工智能学院的孙仲研究员团队带来了好消息，他们专注于非负矩阵分解这种核心算法，成功给这一领域装上了新的引擎。这款“基于阻变存储器（RRAM）的非负矩阵分解模拟计算求解器”，把传统数字芯片只能处理二进制“0”“1”的思路给改了。它利用欧姆定律和基尔霍夫定律直接在模拟域运算，很适合矩阵这种大规模并行任务。团队在设计上有两大突破：一是用RRAM阵列做成模拟单元，把数据存在忆阻器的电导状态里，实现了存算一体；二是搞出一种可重构紧凑型广义逆电路，用电导补偿原理优化了最费时间的步骤，做到了一步求解。这套系统不仅速度快了、面积小了，功耗也跟着降下来。为了验证效果，研究团队在测试平台上做了严格对比。在图像压缩任务里，这芯片的视觉效果和全精度数字计算机跑得差不多准，存储空间还省了50%，说明它适合在边缘设备上干活。在推荐系统里误差也很小。更厉害的是在网飞（Netflix）那种大数据量的场景下，速度比现在的数字芯片快了12倍多，能效比更是暴涨了228倍以上。这样的能效提升意味着处理同样的任务只需要原来百分之一的能耗，对于建绿色的计算基础设施特别有意义。这次突破不只是造了个好芯片，更是在探索新的计算范式。它可以给手机推荐、物联网高清处理还有基因测序这些对功耗敏感的地方直接赋能。现在全球都在抢下一代计算架构的头把交椅，北京大学的这项成果给咱们打破“能效墙”、搞出自主可控的技术体系加了不少砝码。随着工艺进步和系统集成度提高，这类专用芯片有望跟通用处理器联手打造出更高效的智能生态圈，帮咱们在人工智能和集成电路交叉领域实现科技自立自强。