最近有人说RAG没了,那我可不同意。今年刚出个头,网上就闹得挺热,Skill、OpenClaw这些新东西起来了,RAG这种前几年大家都用的技术就有点被冷落了。不过我在企业里干了这么多年,觉得RAG肯定没死,只是脱掉了那些花哨的外壳,回到了做数据基建的老路上。现在技术底子变了不少,大模型的Zero-shot推理能力特别强,指令执行得很利索,长文本也能装下,而且信息丢失的程度已经在可接受的范围里了。更关键的是算一次钱还不贵。这么一来,以前在生成端费大劲搞的那些复杂工作——提示词工程、风格控制、多轮对话管理——其实没啥用了。现在模型自己就能表达得很专业,逻辑推理也不差,外面套的这些壳子反而会限制它。最近流行的Agentic RAG也不是啥好办法,人为编流程或者做路由智能体,这其实是大家太想控制流程了,以后肯定会变成系统的瓶颈。真正要走的路是把这些复杂的事都交给数据治理层去管。未来的知识库可能就像个Data Proxy(数据代理),既能当Server又能执行Skill,按照MCP协议来干活。 这就有两个重点需要搞:一个是把那些乱七八糟的异构数据管好,重新弄清楚每个知识单元是啥。直接用文档本来的结构搭个带上下文的节点,把图表啥的都挂上头,保留住完整的业务逻辑。另一个是搞个渐进式搜索,让每个节点都能展开。把Search和Explore的API开放出来给模型用,让它们自己去摸索。这虽然会慢点,但现在算一次钱便宜了,换来业务问答的绝对准确还是划算的。RAG其实没走,就是完成了个阶段性的任务。咱们做知识库的工程师以后的工作重心得变变了,别光想着“教模型说话”,得把注意力放到怎么给企业建条高效读取数据的“高速公路”上来。