国家数据局局长点名了token 这个新概念,直接把它定义为智能时代的价值锚点,也给了它一个中文翻

就在3月22日至23日中国发展高层论坛2026年年会上,国家数据局局长刘烈宏点名了Token这个新概念,直接把它定义为智能时代的价值锚点,也给了它一个中文翻译:“词元”。这意味着词元不光是评估大模型调用量的尺子,还是各大厂商卖套餐的结算单位,为商业模式落地提供了能算清楚的标准。 刘烈宏在24日的新闻发布会上透露,到今年3月,中国的日均词元调用量已经超过了140万亿。这可比2024年初的1000亿翻了1000多倍,比起2025年底的100万亿,这三个月又增长了40%多。这说明咱们的AI发展已经进入快车道。他还提到,大家现在都在关注“出海”,这恰恰说明产业竞争力在增强。 关于数据建设的成果,刘烈宏也说了,各方共同努力下,高质量数据集现在已经有超过10万个了。这些数据集的总量达到了890PB,大概相当于中国国家图书馆数字资源的310倍。接下来国家数据局会继续推进数据赋能AI创新,按场景需求牵引,打造技术上可行、质量有保障的AI-Ready(AI就绪度)高质量数据集。 到底什么是Token?在AI的世界里,它就是模型处理信息的最小单位。不管是用户提的问题还是AI写的代码,最后都得被拆成Token去运算。正因为如此,Token调用量成了衡量AI模型活跃度和产业价值的关键指标。调用量越大,说明模型被用得越频繁,创造的实际价值也就越大。 尽管现在还在谈2024年和2025年的数据对比,咱们已经在2026年年初实现了日均140万亿词元的调用量突破。随着各方继续努力搞数据集建设,相信未来还能看到更多像这样的大发展。