你家电脑里其实有块看不见的显存,到了2026年,这块“隐藏显存”能帮你把14GB内存腾出来跑大模型。很多苹果硅Mac都在用统一内存,系统默认是给CPU/GPU用的,平时看着都占满了,其实里面有一部分是CPU留出来的。要想把这块内存挖出来给GPU用,主要得靠手动调整VRAM的上限。具体操作是在终端里按2的幂数来设置数值,比如4096、8192、14336、28672这些单位。改完以后重启应用,记得盯着Activity Monitor看内存压力和swap情况。别一上来就把内存全给GPU,先把重要文件备份好再一步步试。 为什么会有这种情况?苹果硅用的是UMA架构,CPU、GPU还有加速器都在一块物理内存里打架。为了保证系统稳当和响应快,系统肯定要留点余量给CPU用。这不是系统漏洞,纯粹是为了照顾大多数图形任务的需要。如果你是搞开发的或者是AI爱好者,在本地跑模型的时候就会觉得很憋屈,这时候就得手动干预一下。不过要是你的活儿对稳定性要求高或者不太会用命令行,最好还是别折腾。 动手之前必须知道风险有多大:内存压力蹭蹭往上涨、swap变得多了、电池续航变短、官方支持态度也不一定好。准备工作就是先做好Time Machine备份或者手动拷文件,确认macOS和M系列芯片兼容了,再准备好终端、Activity Monitor和LM Studio这些工具。 高阶操作的核心是按2的幂数设置VRAM。流程就是备份好先→关掉吃内存的敏感应用→在终端里输入命令修改GPU的上限→重启LM Studio或者目标进程→观察记录结果。命令格式大概长这样:sudo <工具名或系统接口> --gpu-vram