“词元”到底怎么说好?

说句实话,现在大模型为了更快干活,“词元”这东西可真是成了关键的指标。你看它就相当于咱们说话的一个字或者一个词,甚至是个符号。说白了,只要你在网上聊个天、发个朋友圈,或者让AI给你画个画,那“词元”就没少消耗。到了今年3月,我国平均一天的Token(词元)调用量竟然突破了140万亿。你可能觉得这数字挺吓人,但其实换算下来也挺直观的。国家数据局专家咨询委员会的张向宏委员就给咱们算过一笔账:这140万亿的调用量,相当于1000万亿个中文词汇,差不多就是250个中国国家图书馆那么多的资料。国家发展改革委国家信息中心人工智能处的蔡驰宇工程师说,这种大幅增长的趋势说明啥?说明AI正从实验室的概念变成咱们日常生活和各行各业都能用到的工具。现在的AI就像水电网络一样,成了智能社会运转的基础资源了。 既然“词元”这么重要,围绕着它的买卖自然也得变一变。现在好多企业用信息服务都不再是买个软件放那儿不动了,而是直接调用大模型的接口,用多少就付多少钱,完全是以“词元”来算账。国家数据局的负责人也提到了这个趋势。这套新的计费体系正在形成,甚至可能成了AI产业挣钱的主要门路。不过话说回来,“词元”消耗得多了,电也跟着不够用了。这不今年的政府工作报告里都提到了要搞算电协同这些新基建吗?国家数据局专家咨询委员会的张向宏委员解释道:这本质上就是用咱们国家有优势的绿色电力来发展算力和AI产业。 说到这名字翻译的事儿也是挺麻烦的。“词元”到底怎么说好?记者24号从全国数据标准化技术委员会打听到了好消息:全国数标委正在加紧推动一系列数据领域新名词新术语的解释和国家标准工作,目的就是给AI产业发展更好地赋能。(总台央视记者 丁雅妮 刘柏煊 王刚)