华为放大招:让ai 行业化落地的难题来个大破解

华为这一次在3月17日放出了全新的AI数据基础设施,说要给AI行业化落地的难题来个大破解。咱们过去几年搞的都是深度学习训练那一套,现在AI已经变成了以推理为核心的阶段。企业现在的变化也挺大,一个是数据变得杂了,有文本也有图片视频,量也从TB级直接干到了EB级;另一个是资产概念变了,从单纯的“数据”变成了“知识”和“记忆”,大家都得用这些东西实时地帮智能体做决策。这就逼着数据基础设施得换个活法,不然就跟不上趟。 华为这次放出来的AI数据平台,主要是想解决知识质量不够、长序列处理慢、还有缺乏记忆这几个大坑。它把知识库、KV Cache加速和记忆库都给整合了起来,还加上了UCM技术去调度管理,算是把企业搞AI的门槛给降下来了。咱们知道数据老是在变嘛,要是不及时把知识转换出来,模型给出的结果就不准了。华为的平台用多模无损解析、Token级编码这些招数,把文本图片视频都变成细颗粒度的知识,再结合多维度检索和重排序,能做到超95%的知识检索精度。 在处理长文本或者多用户并发的时候,KV Cache这层缓存很容易存不下东西,系统响应就慢了。华为平台专门给搞了个全局分层缓存能力,让数据在On-chip memory、DRAM还有外置SSD这三层里面按需流动。这样一来KV Cache的存储池就变大了不少。再配上稀疏注意力算法避免重复计算,上下文窗口也能扩大不少。最明显的变化就是首Token时延能降低90%。 另外现在大模型普遍缺记忆,记不住中间结果和历史经验。华为说它的平台能保持上下文状态、凝练信息,记得越多推理就越准,“越用越聪明”。这次平台还提供一体化和独立式两种部署模式。独立式部署用的是“数据引擎节点 OceanStor Dorado”架构,可以直接加到现有的存储系统里保护投资。 除了中心场景的平台,华为还给分支边缘场景弄了个FusionCube A1000 AI超融合一体机。现在好多数据都在边缘产生呢,传统的改造太麻烦、成本又高、效率还低。有了这个一体机就简单多了。