黄仁勋刚说完,智能体人工智能的拐点已经来了,这玩意儿的算力需求就跟坐火箭一样往上蹿。大家心里都清楚,这事儿意味着AI的世界要变天了,传统的模型像是个死板的工具,现在AI成了活生生的“智能体”,能自己想办法、做决定。咱们得先把这“智能体”在计算机科学里到底是个啥搞懂。以前那种图像识别或者写文章的模型,本质上就是在那瞎猜概率,你给它个照片或者一段话,它就给个回应。现在的Agentic AI就不一样了,搞了个“环境感知-决策-行动”的闭环系统,不光是处理信息,还得一直盯着周围的环境变不变,根据自己心里想的定好计划,动手去干(比如用工具、写代码、操控软件),干完了还得回头看看效果对不对,好再改改策略。打个比方,以前的AI顶多给你写封草稿信,现在的Agentic AI能直接翻你的收件箱,看看信的紧急程度,写完发出去。这从静态到动态的进化,直接把计算需求给翻了个个儿。以前的算力主要是用来把模型参数练大,或者处理更大的图片和视频。现在智能体一直在线干活,计算任务不再是那种一会儿大一会小的断断续续的活儿,而是要不停地跑。智能体得把周围的情况和任务状态记在脑子里,实时更新来推理怎么做下一步的事儿。每做个决定都得把脑子里那些庞大数据激活一次来看看到底有啥结果。这种一直不停的思考过程,就是算力需求疯涨的原因。 这种疯涨具体体现在哪呢?就是对硬件和基础设施要求特别高。那些处理数据的单元得有特别宽的内存带宽和海量的容量,因为智能体要存的中间信息多得吓人。计算还得支持复杂的逻辑判断和条件判断,这就让芯片设计不能光盯着矩阵乘法优化了,得改成支持复杂控制流的异构计算架构。一个智能体一直跑还不够,要是有成千上万个智能体一起工作,压力就从数据中心内部蔓延到了网络边缘和云端的协同系统里去了。 这股趋势告诉我们信息技术基础设施的评价标准也得改了。以前大家只看最高能跑多快(峰值浮点运算能力),以后可能得看它能不能长时间做复杂推理、能不能一下子处理好多决策任务、还有多个智能体一起干活时能不能顺畅通信。 硬件和软件也得跟着变方向,不能光是图速度快了,得安全可靠还得能持续不断地干活才行。 总结来说就是三点:智能体让AI不再只是个工具;这种模式把计算任务变成了连续交互的活儿;指数增长的算力需求逼着整个产业去改标准和技术路线。