MemoryS 2026聚焦推理时代存储“瓶颈墙”:闪迪以QLC与系统级方案加速全域落地

(问题)随着大模型推理、智能体工作流及多场景AI应用加速落地,数据挑战正从“能不能存下”转向“取不取得到、用得够不够快、成本高不高”。业界普遍反映,计算能力快速提升的同时,数据搬运、索引与随机访问带来的时延与功耗压力同步上升,“存储墙”正成为影响推理效率、成本控制与体验稳定的重要瓶颈。尤其在数据中心侧,训练与推理并行、数据湖持续扩张、向量检索与键值(KV)访问更频繁,使存储系统从单纯堆容量,进入更强调架构适配与系统协同的新阶段。 (原因)一上,推理场景呈现高并发、小批量、低时延的访问特征,传统依赖预填充计算与大规模内存占用的方式成本高、能耗大;另一方面,边缘端与移动端在功耗预算、散热空间与持续写入耐久性上更为苛刻,需要存储在有限能耗下保持响应速度与稳定性;此外,车载与物联网走向“全天候在线”,带来长时间连续写入、环境适应与可靠性验证等更复杂要求。多重需求叠加,推动NAND与SSD产品从“容量驱动”向“架构驱动、平台驱动”演进。 (影响)上述变化正在重塑存储产业的竞争焦点:其一,单位容量成本与能效成为大规模部署的硬约束,QLC等更高密度路线加速走向主流;其二,存储不再只是被动承载数据,而是参与系统优化,通过缓存卸载、缩短数据路径等方式直接影响推理时延;其三,多终端、多场景加速融合,要求厂商在数据中心、边缘、移动、车载与物联网之间形成可复用的平台能力与产品矩阵,以降低总体拥有成本并提升交付效率。 (对策)在大会演讲中,闪迪公司全球产品高级副总裁埃里克·斯潘诺(Eric Spanneut)表示,NAND市场正迎来多重机遇,产品策略将从单点性能或容量竞赛转向“技术—平台—系统”协同:通过前沿NAND技术迭代、融合式平台架构与系统级能力推动产品加速向QLC转型,并针对不同负载提供差异化方案。 在云与数据中心领域,闪迪围绕数据湖与高密度部署需求,推出基于BiCS8 UltraQLC的SSD方案,单盘容量最高可达256TB,面向快速数据湖等场景,以更高密度提升单位机架有效容量。在推理涉及的的KV访问场景中,闪迪强调将KV缓存负载卸载至SSD,可减少预填充计算带来的等待,从而缩短首次令牌生成时间(TTFT)。同时,面向新型KV缓存应用,提供具备更高耐久指标与适配能力的企业级SSD产品,容量最高32TB,并以3DWPD等参数强化对持续写入负载的支撑。 在移动端领域,针对终端侧本地推理、影像处理、实时翻译等需求增长带来的读写并发与功耗约束,闪迪展示基于QLC NAND的UFS 4.1嵌入式闪存方案,通过SmartSLC缓存等设计在提升响应速度的同时延长QLC耐久性,并强调在约2瓦功耗下实现高吞吐与节能运行,以适配新一代移动平台对性能、密度与续航的综合要求。现场信息显示,其QLC UFS 4.1新品已提供多档容量规格并进入样品阶段,计划于2026年4月推向市场。 在车载领域,面向智能网联汽车与软件定义汽车带来的多传感器数据采集、座舱交互、辅助驾驶等复杂负载,闪迪推出车规级UFS 4.1嵌入式闪存,以及面向高性能中央计算架构的NVMe SSD产品,旨在为车载AI数据底座提供更高带宽、更高可靠性与更稳定的长期供给能力。车载场景对温度范围、数据完整性与生命周期管理要求更高,车规级存储的系统验证与供应链稳定性因此成为关键。 在边缘AI与客户端领域,闪迪提出以PCIe Gen5与QLC架构推动客户端SSD走向高能效设计,面向边缘侧推理、轻量化训练与内容生产等工作负载,在提升性能的同时强调在能耗与散热约束下的持续稳定输出。 在物联网领域,随着视频监控、工业采集等24小时连续录制需求增长,封装与密度成为提升单点部署能力的重要抓手。闪迪表示将通过封装创新提升存储密度,并以高耐久设计满足全天候持续写入场景,单品容量可达1.5TB,显示QLC在物联网场景中的适配性正在增强。 (前景)业内普遍认为,随着推理规模化部署、数据湖与向量化应用扩展,存储系统将继续呈现三大趋势:一是高密度QLC等路线在更多企业与终端场景加速普及,以成本与能效优势支撑规模扩张;二是“计算—存储—网络”协同优化将从工程实践走向可复用、可标准化的能力,存储将更深度参与时延控制与数据路径优化;三是从数据中心到车载、边缘、移动与物联网的全域协同将成为厂商构建竞争力的重要方向,平台化与系统级能力将决定产品落地效率与长期服务能力。闪迪表示,NAND仍将持续演进,以应对不断变化的存储挑战,并推动闪存创新覆盖更多行业与场景。

在全球数字化进程加速的背景下,存储技术正成为支撑人工智能、智能驾驶等应用的重要基础设施。闪迪此次技术布局不仅反映了上游厂商的研发方向,也折射出存储行业从单一性能竞争转向面向场景的解决方案竞争。未来,如何在性能、成本与可靠性之间取得平衡,仍将是市场竞争的关键。