
从训练到推理,AI的核心度量正在从算力投入(FLOPS,每秒浮点运算次数)转向有效产出(tokens)。
2024年,未尽研究的报告《AI改变能源》,估算了2030年中国所需要的智能算力总量,以及相对应的电力需求总量,采用的正是FLOPS的指标;2026年,最新报告《首届AI世界杯》,估算了赛事期间全球AI推理规模及观众使用情况时,采用的则是tokens的指标——这是FIFA近年来统计历届世界杯的收视(人头数)、流媒体流量(比特数)之后,首次用token来刻画这一宏大的人类科技应用场景。
智算如何引领新型电力系统:《AI改变能源》报告发布2024/08/07 完整阅读 >
]article_adlist-->首届AI世界杯:场景的胜利2026/03/08 完整阅读 >
]article_adlist-->算力基础设施正在复刻电力基础设施的统计逻辑。FLOPS对应着“装机量”,tokens对应着消耗量——它衡量着数据中心的实际负载。在智能经济时代,围绕token的使用强度、终端用户结构与边际成本展开的统计与分析,将像用电量之于工业经济一样,成为理解智能经济运行的关键指标,也展示出中国宏观经济日益高质量的一面。
企业是公布token消耗量的先行者,未尽研究在国内较早跟踪并分析主要AI企业token数据。谷歌曾披露,在2024年4月,公司当月消耗了约9.7万亿tokens。这也是科技巨头最早公开披露token消耗量的官方记录之一。此后,谷歌与字节跳动均会不定期公开这一指标,以揭示AI应用落地的速度与程度。与FLOPS类似,token并不是的完美指标。但它仍是当下衡量AI巨头市场地位不可或缺的维度。
对token消耗量的重视,正在向组织内部延伸,也定义着一些企业关键的战略方向。部分硅谷企业正在将员工的每日token消耗量(TDP)视为运营考核指标。今年,阿里巴巴将旗下AI业务重组至阿里token事业群(ATH),要围绕创造token、输送token、应用token大做文章,这样一来,token将成为其基础运营指标。不知将来它是否会加入谷歌与字节的行列,在电话会议中对当季token的消耗与产出披露一二。
官方统计也在迅速跟进智能经济快速发展的现实。这一次中国跑到了美国前面。尽管token尚未进入中国官方统计文件,但已开始在重要政策场合被频繁引用。
昨日,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏关于“智能经济新形态”的演讲,就提到:2024年年初,中国日均token调用量为1000亿;至2025年底,跃升至100万亿;今年3月,已突破140万亿,两年增长超千倍。在今天的国新办新闻发布会上,刘烈宏局长再次引用了这个数据,并明确其中文名为“词元”——这个词的确发生于对自然语言中的单词进行切分,尽管后来也进入图像、视频、声音等其他模态。
在官方定义中,token是大模型处理信息的最小单元,具有可计量、可定价、可交易的潜在属性。围绕token的调用、分发与结算,一套新的价值体系正在形成。它不仅是智能时代的“用量指标”,也可能成为连接技术供给与商业需求的“结算单位”,为AI商业模式提供可量化的基础。
然而,与电力不同,token的统计远未标准化,其测算本身仍充满不确定性。一方面token产出取决于算力供给能力,另一方面也取决于算力需求的增长速度。两年前,中国短暂经历过智算中心的“闲置”。芯片乃至整个基础设施的性能、模型的算法,以及应用场景对高吞吐还是低延迟等工作负荷的选择,不同技术路径与业务形态,都会显著改变token的生成与消耗结构。
3月19日,在华为中国合作伙伴大会2026上,华为高级副总裁李鹏就称,中国日均token消耗量已跃升至180万亿。略高于国家数据局披露的数据,但仍处于同一数量级。类似的差异,反映的是口径与方法尚未统一。
再早一个月,在“AI 2028危机”报告刷屏的时候,我们也曾估算,在春节期间,全球日均token消耗已经超过了300万亿。结合中国与美国在全球AI竞争中的领导地位,我们的估算,与前两家基本靠谱。
“AI 2028危机”,究竟有多少已然发生2026/02/24 完整阅读 >
]article_adlist-->未尽研究的估算逻辑是,当前阶段,由于算力紧缺,token增长实际上主要由算力供给约束,是一个卖方市场。既然如此,不如多听听英伟达CEO黄仁勋是怎么说的。
算力紧缺的证据相当充足。美国的科技巨头、云巨头和新云企业(neocloud),对AI基础设施的大规模投资,从2025年才真正开始。中国科技公司亦是如此。在此之前,AI应用的渗透率也较低,这意味着供给与需求的波动,都会动辄数量级地放大token消耗量。这也是过去两年中国token调用量能够“千倍增长”。
这一供给约束,在企业层面表现得尤为明显。AI应用日益走向代理化(Agentic)与多模态,今年以来编码及工作智能体迅速渗透知识经济、OpenClaw掀起个人智能体热潮、视频生成借助春节等场景在中国迅速普及,不断创造新增需求,算力资源的分配高度紧张,处于拆东墙,补西墙的阶段。Anthropic所有套餐(消费者版、专业版、企业版、API 版)都存在使用量限制和费率上限。腾讯的策略则是“减少了对外出售,以保证自用算力充足”

算力供给紧张,将持续相当一段时间。它是系统性的难题。在全球范围内,包括AI芯片与HBM,它们的先进制造及先进封装产能都面临长期不足;在美国,紧缺更表现为电力基础设施的供给不足。分析师Dylan Patel认为,很快AI产业的瓶颈将转移至下游半导体制造设备,尤其是EUV光刻机产能。
既然当前的token增长,本质上不是用户需求的释放,而是算力供给的释放,那么,在这一体系中,英伟达所代表的算力供给侧,就居于统计的核心位置。没有人比黄仁勋更懂token与AI工厂。他开始围绕设计高效产出token的工厂,联合了200多家合作伙伴,是最接近较全面掌握token经济的人。
在今年CES的主旨演讲中,黄仁勋提到,每年在推理阶段生成的产生的token数量会增长5倍。他在GTC 2026上还说,下一代的VR NVL72,可以提供比GB NVL72高35倍的tokens产出。

这两个数据其实并不矛盾。因为VR NVL72无法在发布之后,一夜之间完成部署。AI芯片的出货,本身就需要经历一段时间的产能爬坡。截止到2026年一季度,也就是当下,按出货量计,Blackwell系列也尚未完全超过Hopper系列。更何况,电不到位,通电的数据中心建筑(Warm Shell)不到位,GPU买的再多,也只能躺着吃灰。微软CEO纳德拉就承认,公司犯过这样的错误。
至此,让我们简单推算一下。去年10月,谷歌公布日均消耗43万亿tokens。当时,谷歌模型在OpenRouter市场占比25%。那么,当时全球相当于日均消耗170万亿tokens。加上更多因素,我们也就因此可以保守估算出,今年世界杯举办的6月至7月期间(共计39天),全球日均tokens消耗量超过535万亿。
不过,随着英伟达逐步失去它在算力市场的垄断地位,也包括中国加快形成自主完整的AI算力生态,以及AI从供给约束逐步转向需求驱动,统一的token计量标准将变得愈发重要,这是智能经济市场真正形成的标志。
伴随着一些地方政府通过“养龙虾”政策表现出来的AI+的热情,以及国家对建设智能体经济与社会的重要里程碑的确立,预计地方政府也将很快公布自己的token消耗统计数据,在北京、上海、杭州、深圳等为代表的城市之间,形成你追我赶的态势。
--
附:
我们的估算方法及数据
海量资讯、精准解读,尽在新浪财经APP
杠杆炒股提示:文章来自网络,不代表本站观点。