“东数西算”这事儿才能真正落地生根

东数西算计划推出快一年了,现在大家都在说算力很重要,可实际干活儿的存储设备却常常被忽视。毕竟,全网95%的数据都是那种平时不怎么用的温冷数据,关键不是有没有足够的计算能力,而是“存得下、读得快”,这才是真正的痛点。最近有个研讨会,华中科技大学的吴非教授还有其他业内人士坐下来一起聊,给大家解释了这个问题。吴非教授就说了,“算力是中心,存储是根基”,现在计算机运算速度都快到纳秒级别了,可存储设备的I/O响应还在微秒级徘徊,这就成了最大的短板。赛迪顾问还预测,到了2025年,咱们国家可能会出现一个高达420EB的存储缺口。 那为什么大家都看不上存储呢?除了刚才说的存算速度不同步,东数西算本身也带来了四大挑战。第一个是容量爆炸:这么大的数据量摆在那里,“便宜、大碗、长寿”的存储设备得赶紧跟上;第二个是性能飙升:像AI训练、云游戏还有XR渲染这些场景,对西部数据中心的要求可高了,带宽得够宽,延迟还得低;第三个是安全红线:数据事关国家安全,开源软件太多也容易出岔子;第四个是绿色考核:全国一体化数据中心的PUE指标要小于等于1.2,这就逼着大家都得想办法减排。 为了破解这个难题,我们得先从顶层设计入手。不能只看重算力而不管存储了,得让存储容量和计算核心数一起往上走。服务也得均衡一下,别让大部分时间都花在读写数据上。存内服务占比得从30%提升到70%,这样算力的效率才能提升3倍。生态还得开放,别让各个厂商之间互相掐架。大家一起打造统一的接口和协议才是正经事儿。 技术上也得有新招数。得搞出一套一体化的“五维”战略来。先说海量存储:单集群能轻松装下300PB甚至更多的数据,还能横向扩展到EB级别。数据融合也得跟上:一套系统得兼容NFS、SMB、iSCSI还有CIFS这些协议。不管是哪种数据类型进来都能顺畅流通。安全合规更是重中之重:分布式存储最好用国产芯片和算法来做端到端的加密和审计检查。绿色低碳方面也不能含糊:业内第一款液冷存储方案已经出来了,PUE能压到1.1以下。智能运维也得跟上节奏:用AI来预测故障、自动巡检和扩容。这样一来,存储就能像算力一样随叫随到了。 最后还得靠产学研用一起来发力。高校联合实验室能提前验证新技术;开放源代码能让大家一起改进产品;标准得先定下来;产业联盟也要建立起来。只有大家联手干事儿,才能让“好存力”有个衡量的标准。只有把“重算轻存”的旧观念彻底打破,把存储当作和算力一样的重要资源来对待,“东数西算”这个事儿才能真正落地生根。等到西部那些冷数据被高效地“喂”给东部的算力中心的时候,“东数西算”就不是个口号了。