那最近,OpenAI搞出了个大动作,要求自己的工程师团队,必须在3月31号前把AI代理变成主要的开发工具。这明显就是在给竞争对手Anthropic施加压力嘛。就在短短六周时间里,Codex这个平台一口气推出了七项重大更新,不管是模型升级、安全审计还是跨平台支持,那是样样都来了,攻势真的很猛。2月5号发布的GPT-5.3-Codex,OpenAI自己说是第一个能自己创造模型的东西。在Cerebras硬件的支持下,它的推理速度能冲到每秒1000tokens。3月5号出来的GPT-5.4就更厉害了,把编码、推理和原生计算机操作全给合到一块了,还支持百万token的上下文窗口。这些升级让Codex能搞定更复杂的开发任务,从写代码一直延伸到做项目级别的安全审计。安全代理在测试的时候扫了120万次代码提交,找出了近800个高危漏洞。市场那边反应也特别热烈,现在开发者社区里很多人开始两手都要抓:Claude Code负责想点子做规划,Codex就专门去干活优化代码。这是因为它们特性不一样嘛,Claude像是个很有创造力的美国工程师,Codex就像个专注执行的德国工匠。数据显示,Codex的周活跃用户今年年初以来涨了超过300%,付费开发者都突破百万大关了。 这次竞争真的是人才都在流动啊。OpenClaw创始人Peter Steinberger也加入了Codex的团队,他可是个擅长搞长时间运行代理系统的专家。这下子就更能看出Codex的野心了——他们打算从单纯的编码工具升级成一个真正的AI原生开发平台。现在GPT-5.4已经能跨应用操作了,再配上正在完善的插件生态系统,那个能从规划到部署全都搞定的智能平台轮廓已经慢慢看出来了。 现在的竞争焦点又变成了代码审查效率的问题。Codex团队说他们生成代码的速度已经快到离谱了,比人还快。这就逼着行业得去想办法做自动化验证。他们试着让AI去重现用户操作的路径来证明修复到底管不管用,“可证明的修复”这个机制说不定会重新定义整个开发流程呢。随着3月31号截止日期越来越近,OpenAI这股冲刺的劲头一点都没减下来。这场由编码工具引发的平台级竞争,确实正在改变人工智能的开发方式啊。 技术选型这块也有大动作。Codex平台超过90%的代码都是自己生成的。工程师的角色也变了,不再是码农了,变成了代理管理者。每人手里能同时运行4到8个并行代理去处理不同的任务。他们还用Rust语言写的CLI工具替代了原来的Typescript,再配合分层代码审查机制,把AI生成的代码审查通过率给拉到了90%。到了晚上系统还会自动巡检一遍,等工程师上班的时候修复建议就已经准备好了。 安全方面的突破也是挺大的。Codex Security在预览阶段就挺牛了,误报率比传统工具少了50%,噪音也减少了84%,像OpenSSH、Chromium这种关键开源项目它也都能覆盖到。这种从代码生成到安全审计的完整闭环确实很厉害,标志着AI编码工具正往开发平台方向大步迈进呢。 开发者生态那边也在分化呢。Reddit上有讨论说67%的开发者认可Claude的代码质量,但Codex因为性价比高更受大家青睐。某家AI公司的首席架构师说得挺有意思的:Codex去处理那些低延迟系统的开发工作,Claude则负责设计UI界面,两者配合起来干活效率很高。这种混合使用模式现在已经开始重塑大家对开发工具链的评价标准了——不再光比模型性能,而是看能不能真正提高实际的工程效率。 要知道这AI原生开发平台的路还长着呢。之前还有个情况也挺有意思:有个AI开发公司的首席架构师描述了个场景:他们公司就用Codex处理那些低延迟系统的开发工作,Claude就用来主导UI设计工作。你看这样两者形成互补关系多好啊。 这次竞争确实挺激烈的。现在大家都在关注一个新的焦点:代码审查效率的问题已经变得很关键了。Codex团队透露说他们模型生成代码的速度已经远远超过了人工审查的能力了。这就逼着行业得去探索自动化验证的方案了。他们甚至尝试让AI通过重现用户操作路径来证明修复是不是真的有效。这个“可证明的修复”机制可能会重新定义整个开发流程呢。