问题——高景气之下,增长能否持续与结构是否生变 近期,多家芯片与算力对应的企业公布的业绩和指引显示,人工智能带动的半导体需求仍处高位,相关收入保持较快增长,订单规模持续扩大;从市场表现看,“卖铲人”本轮产业周期中收益显著。然而,在表面繁荣之下,算力供需关系、技术路线与商业合作正在发生微妙变化:一上,企业继续加码资本开支、锁定产能;另一方面,关于通用芯片效率、推理成本、以及训练—推理结构性分化的讨论明显升温,部分头部企业间的投资与合作节奏也出现调整信号。这些变化共同指向一个现实命题:算力投入再创新高之际,产业增长逻辑正从“规模扩张”转向“效率竞争”。 原因——数据、工艺与成本约束叠加,“越堆越强”的路径边际趋弱 业内普遍认为,过去数年大模型能力跃升与“缩放规律”密切相关,即通过更大模型、更大数据、更大算力推动性能提升。在该阶段,通用GPU凭借成熟的软件生态、灵活的并行计算能力,成为训练与部署的核心底座,并支撑起高溢价与持续供不应求的市场格局。 但当前约束逐渐显现。其一,数据端出现“吃尽效应”。公开的高质量、结构化数据增长放缓,边际贡献下降,单纯堆叠算力难以线性换取模型能力跃迁,业界开始更多转向后训练、推理时扩展和结构优化等路径,其关键词集中于“提效”“分配优化”“面向任务”。其二,制程演进带来的单位性能提升放缓,而成本上升压力加大。先进制程的收益与代价关系变化,使得“依赖工艺迭代推动代际跃升”的确定性降低。其三,算力采购与云端资本开支进入更紧的回报核算周期。随着投入规模扩大,云厂商与模型企业需要在更短时间内证明投资有效,倒逼从“抢资源”转向“算清账”。 影响——通用GPU统治地位松动,定制化与分布式需求抬头 上述变化正从多个层面重塑产业链。 在芯片侧,通用GPU仍将是重要选择,但其“绝对最优解”的地位受到挑战:当推理成为成本中心、当场景对延迟、能耗与单位成本更敏感时,更多企业会考虑专用加速器、ASIC或面向特定工作负载的异构方案,以换取更稳定的性价比。对芯片厂商而言,这意味着竞争不再只靠制程与单卡性能,更在于系统级能力、软件适配、供应链协同与客户定制服务。 在云与数据中心侧,集中式超大规模建设仍会延续,但“以规模换优势”的模式面临效率约束。企业会更重视资源调度、模型压缩、混合精度、稀疏化、以及端云协同等工程化能力。同时,“定制化”“个性化”的行业落地需求增多,推动算力形态从单一集中走向多层次分布:既要中心云的训练能力,也要区域节点与边缘侧的推理与响应能力。 在产业合作侧,围绕采购、投资与产品路线的博弈或将增多。头部模型企业一上需要稳定供应与生态支持,另一方面也会出于成本、性能与议价考虑推动多供应商策略,甚至尝试自研与联合定制,从而降低对单一硬件路线的依赖。这类调整并不必然意味着对立,更可能是产业进入成熟期后的“结构再平衡”。 对策——以提效与协同应对新周期,构建更可持续的算力体系 面向新阶段,各方需要从“拼规模”转向“拼效率、拼协同”。 对模型企业而言,应强化数据治理与后训练体系建设,提升高质量数据供给能力;在工程侧推进推理优化与算力精细化管理,降低单位调用成本;在供应链侧保持多元化与可替代方案,增强抗风险能力。 对芯片与系统企业而言,要在软件栈、编译器、通信互联与集群管理上持续投入,减少迁移成本与生态壁垒;针对推理与行业场景提供更明确的性价比指标与端到端解决方案,以“系统级竞争力”争取长期订单。 对云服务商与产业用户而言,应建立更透明的投资—收益评估框架,避免非理性扩张;推进算力资源共享与标准化接口建设,促进跨平台适配,降低重复投入。 前景——从“算力军备竞赛”走向“价值落地竞赛”,产业或迎结构性分化 可以预期,短期内全球算力需求仍将保持高位,头部厂商订单与收入可能继续增长。但中期看,增长的驱动力将从训练规模扩张转向推理侧的广泛部署与行业落地,产业竞争的焦点将转移到单位成本、能耗效率、交付周期和可靠性等指标上。 未来一段时间,行业或呈现三类趋势:一是算力结构从“训练主导”逐步转向“推理主导”;二是芯片从单一通用走向异构并存,专用化比例提高;三是资本开支从“押注式投入”走向“滚动式验证”,合作关系更强调对等与灵活。能在效率与生态上形成闭环的企业,将更有可能穿越周期。
人工智能产业正处在关键转折点。当前的技术路线调整和市场变化,既是对过去发展模式的反思,也是对未来方向的探索。如何在规模与效率、通用与专用之间找到平衡,将决定行业能否实现质的飞跃。对中国企业来说,这既是挑战,也是在全球AI竞争中实现差异化发展的重要机遇。