最近在中关村论坛上,杨植麟这家伙发表了个惊人的观点,说开源技术肯定会大获全胜,这场AI大战最后的赢家很可能是那些“Token工厂”。 看个具体例子吧,月之暗面的Kimi,现在已经被美国那个搞编程的大公司Cursor直接用在了他们旗舰模型里,连负责维护全球20%网站的Cloudflare,这次也宣布他们的Works AI业务要完全基于Kimi K2.5。这几个大动作,其实就说明咱中国团队的技术已经开始往全球的基础设施里渗透了。 说回论坛上的发言,杨植麟反复强调了几点核心。他说咱们的开源模式在能力一样的情况下肯定能赢。原因嘛,就是大家都能在生态里赚钱,最后攒下的产业规模肯定比闭门造车的大得多。 这个生态之所以能起来,很大程度上是因为底层架构有了突破。他说做AI说到底就是把能源变成智能,光是堆资源不行,得比谁转换效率高。现在像Transformer、Adam优化器这些用了十年的老规矩,都得给新玩法让路。像Kimi团队搞的那个“注意力残差”,把注意力机制转个九十度用在网络深度上,多花了2%的成本,性能却能大幅提升。 还有关于智能体这块儿,他看得特别透。他觉得Agent这种东西能长时间干活、处理复杂任务,这跟以前的对话模式完全不一样。这种能力一上来,就带来了处理海量上下文、调用工具这些难题。他干脆直接给定了个经济学上的调子,说以后生产力会变成Agent,Agent产生的Token量,在某种程度上就能直接代表GDP。 至于咱们中国的优势在哪儿,杨植麟也做了个总结。首先是精神头正,愿意开源技术;第二是人才底子厚,北京的人才资源在全世界数一数二;第三是能源和基础设施便宜。他觉得随着模型变强,行业竞争已经从算法本身转向了“Token工厂”的建设,这方面的积累咱们国内很有优势。 最后他还提到研发方式要变了。他说今年开始,AI研发会越来越靠AI自己主导。以后每个研究人员后面都会跟着一堆算力,这些算力能自动找新任务、建环境、找奖励函数,甚至还能探索新的网络结构。这种自进化的能力肯定能把创新速度拉得很快。 再看看这个Kimi K2.5,不光是被大公司用了,其实还反映出中国团队正在从跟跑变成底层标准的制定者。从GTC到这次的中关村论坛,他的讲话都挺一致的。