glm-5是个“大杯”,参数比glm-4.7大了一倍,定位上是对标claude

智谱之前在GLM Coding Plan这块儿确实出了点岔子,这回给大家赔个不是,顺便把优化的事儿也给落实了。说实在的,这次风波主要是因为GLM-5模型上线后资源分配不太顺,大家的服务体验也跟着有点波动。 大家最头疼的“资源消耗快”其实有个说法。因为GLM-5是个“大杯”,参数比GLM-4.7大了一倍,定位上是对标Claude Opus 4.5的复杂任务解决方案。为了省钱,公司设计了个分层用策略,简单的活儿默认找GLM-4.7处理,要用GLM-5就得加钱,高峰时按3倍消耗系数算,非高峰时按2倍算。 其实团队早想到消耗会不一样,可说明里没写清楚具体的倍数是几倍,就把大伙儿给搞懵了。为了让大家心里有底,智谱把数据看板刷新频率从1小时1次变成了10分钟1次,买东西的时候也把分层规则、消耗系数还有灰度发布的计划都给摊开来讲了。 至于用起来卡的问题,主要是遇上了灰产和黄牛恶意抢号,再加上这流量来的太猛,扩容没跟上。所以只能分阶段来放号:Max版本的人现在可以随便用;Pro版本的虽然也放出来了,但高峰期集群可能受不了会限流;Lite版本的得等到节后非高峰的时候再慢慢放开。 不过这也不算啥稀罕事,Claude3.5去年刚出来的时候也遇到了类似的情况。 对于受影响的老用户和新用户,智谱决定给个说法:凡是在2026年1月1日到申请退款那天之间买的单子(不分老新),都可以全额退。特别是对2月12日到16日期间误买新套餐的朋友,提供了一个一键回滚到老套餐的捷径。这就是想尽可能地把大家的损失降到最低,好让大伙儿重拾对服务的信任。