人工智能技术正渗透进各行各业,算力需求也跟着指数级上涨,底层硬件的能效与性能现在成了制约发展的硬骨头。最近北京大学人工智能学院的孙仲研究员团队带来了好消息,他们专注于非负矩阵分解这种核心算法,成功给这一领域装上了新的引擎。这款“基于阻变存储器(RRAM)的非负矩阵分解模拟计算求解器”,把传统数字芯片只能处理二进制“0”“1”的思路给改了。它利用欧姆定律和基尔霍夫定律直接在模拟域运算,很适合矩阵这种大规模并行任务。 团队在设计上有两大突破:一是用RRAM阵列做成模拟单元,把数据存在忆阻器的电导状态里,实现了存算一体;二是搞出一种可重构紧凑型广义逆电路,用电导补偿原理优化了最费时间的步骤,做到了一步求解。这套系统不仅速度快了、面积小了,功耗也跟着降下来。 为了验证效果,研究团队在测试平台上做了严格对比。在图像压缩任务里,这芯片的视觉效果和全精度数字计算机跑得差不多准,存储空间还省了50%,说明它适合在边缘设备上干活。在推荐系统里误差也很小。更厉害的是在网飞(Netflix)那种大数据量的场景下,速度比现在的数字芯片快了12倍多,能效比更是暴涨了228倍以上。 这样的能效提升意味着处理同样的任务只需要原来百分之一的能耗,对于建绿色的计算基础设施特别有意义。这次突破不只是造了个好芯片,更是在探索新的计算范式。它可以给手机推荐、物联网高清处理还有基因测序这些对功耗敏感的地方直接赋能。 现在全球都在抢下一代计算架构的头把交椅,北京大学的这项成果给咱们打破“能效墙”、搞出自主可控的技术体系加了不少砝码。随着工艺进步和系统集成度提高,这类专用芯片有望跟通用处理器联手打造出更高效的智能生态圈,帮咱们在人工智能和集成电路交叉领域实现科技自立自强。