ai热得不行,有个概念越来越重要,它不仅是模型实力的评判标准,也是厂商卖套餐收钱的依据。

Token在中文里有了个名字叫“词元”,这到底是个什么玩意呢?。 现在的AI热得不行,有个概念越来越重要,那就是Token。它不仅是模型实力的评判标准,也是厂商卖套餐收钱的依据。 中国发展高层论坛上,国家数据局的局长刘烈宏说,这个词元不光是智能时代价值的基准,更是连接技术和生意的结算单位,让商业模式有了具体可算的东西。 说到数据规模,刘烈宏提到了一组数字:全国现在有了超过10万个高质量的数据集。到了今年3月,每天处理的词元量超过了140万亿。这可比2024年年初的1000亿翻了1000多倍,而跟2025年底的100万亿比起来,三个月的时间又涨了40%多。 这种爆发式的增长说明中国AI发展特别快。以前可能只是能聊天,现在机器能做出决策、执行任务了。这也反映出数据集多了起来,数据的作用在变大,正形成一个良性循环。 接下来国家数据局打算以场景需求为向导,先搞试点工作。他们会尽力做出技术好用、质量靠谱的数据集,来补上供给的短板。