2026年3月16日,英伟达GTC大会上,黄仁勋在长达两个半小时的演讲中,70多次提到同一个词——”Token工厂”。他把数据中心重新定义为”生产智能代币的工厂”,并断言:”吞吐量和Token生成速度,将直接转化为你明年的精确收入。”与此同时,阿里成立了由CEO吴泳铭直接挂帅的ATH事业群,腾讯总裁刘炽平表态今年AI投入将翻倍至360亿元以上。
如果你只是把这当作又一个炒作概念,可能会错过一次产业级的范式迁移。
用最简单的话解释Token工厂:过去AI公司比拼的是谁能囤更多GPU,就像挖矿时代比谁的矿机多;但现在,行业进入了”卖电力”的阶段——谁能在单位电力消耗下产出更多Token,谁就能赚钱。 Token就是大模型处理信息的最小单位,你让AI写一段话、生成一张图、完成一次推理,背后都是以Token为单位在消耗算力。国家数据局数据显示,中国日均Token调用量已从2024年初的1000亿飙升至2026年3月的140万亿,两年增长超千倍。
这背后是AI产业商业模式即将发生的根本性变革。过去两年,我们经历的是 “模型军备竞赛”,比拼的是谁的参数更多、谁的模型更大;那么从现在开始,行业已经全面进入 “Token产能竞赛” 时代。
这篇文章将用成熟的研究框架,帮你理解:为什么数据中心正在从”存储仓库”变成”智能工厂”?产业链上哪些环节在真正赚钱?不同投资周期应该关注什么样的标的? 这是一套可以至少关注6个月的投研地图,而不是一张一次性的投机清单。
一、Token工厂的核心本质:不是算力租赁的新名字
很多人把 Token 工厂简单理解为算力租赁的新马甲,这是一个根本性的误解。
精准定义
Token工厂是一种全新的 AI 基础设施形态,它将数据中心从传统的 “电子仓库”(存储与算力载体),转型为24小时不间断生产智能的 “数字工厂”。
它的核心生产公式是:
电力输入 + 算力集群 + 算法优化 → 标准化智能输出(Token)
1、Token工厂与传统算力租赁的本质区别
这不是换个名字那么简单,而是从商业模式到核心竞争力的全面重构:
| 对比维度 | 传统算力租赁 | Token 工厂 |
|---|---|---|
| 商业模式 | 卖硬件时间(按卡 / 按时长收费) | 卖智能产品(按 Token 数量 / 质量收费) |
| 毛利率 | 20%-25% | 50% 以上 |
| 核心壁垒 | 卡的数量、机柜规模 | 每瓦 Token 吞吐量、算法优化能力 |
| 盈利逻辑 | 硬件差价 + 运维服务费 | Token 分成 + 增值服务 |
| 行业阶段 | 成熟竞争,价格战激烈 | 爆发初期,格局尚未形成 |
| 客户粘性 | 低,谁便宜就买谁的 | 高,绑定模型与应用生态 |
算力租赁赚的是”地租”,Token工厂赚的是”制造利润”。 前者比的是谁有资源拿到卡,后者比的是谁能把一张卡用出两张卡的效果。九章云极的数据很能说明问题:当前企业GPU利用率普遍低于30%,也就是说100万元的算力投资,实际发挥作用的只有30万,剩下70万”买的是等待”。Token工厂通过资源池化与异构算力统一纳管,可以将利用率提升至85%以上。
2、为什么 “每瓦Token吞吐量” 是AI时代最重要的KPI?
黄仁勋在 GTC 大会上反复强调:”每一座数据中心、每一座工厂,从定义上来说都是受电力限制的。一座 1GW 的工厂永远不会变成 2GW,这是物理和原子的定律。”
在电力约束刚性(一座数据中心的配电容量审批后就固定了)的前提下,谁能从每一瓦特电力中挤出更多Token,谁就拥有更低的单位成本和最强的定价权。红杉资本也明确指出,GPU计算正日益商品化,充裕且低成本的算力已成为支撑数字经济运转的基础设施。
这就是为什么 “服务器数量”、”GPU 卡数” 这些传统指标已经过时了。同样是1万张H100卡,优化得好的Token工厂每瓦Token吞吐量可能是优化得差的2-3 倍,这意味着前者的毛利率可以达到60%,而后者可能连20%都不到。
3、Token:AI时代的 “硬通货”
Token之所以不只是”算力的另一种叫法”,是因为它具备了可计量、可定价、可交易三大特征。国家数据局局长刘烈宏将其定义为”智能时代的价值锚点”,是连接技术供给与商业需求的”结算单位”。
Token是AI处理信息的最小语义单元,1Token≈0.75个英文单词≈1.35个汉字。
但它的价值远不止于此:
- 它是AI服务的最小标准化计价单元,所有大模型API都是按Token收费
- 它是AI产业的通用结算货币,模型厂商、云服务商、应用开发商之间都用Token结算
- 它是可分层定价的商品,黄仁勋将 AI 服务分为五个商业层级:
免费层:高吞吐、低速度,用于吸引用户
中级层:约每百万 Token 3 美元,用于普通对话
高级层:约每百万 Token 6 美元,用于复杂推理
高速层:约每百万 Token 45 美元,用于实时响应
超高速层:约每百万 Token 150 美元,用于高频交易等对延迟要求极高的场景
这意味着,Token的价值不是平均分布的——越”聪明”的Token越值钱。模型越大、上下文越长、推理越深,每个Token的溢价空间就越大。未来,Token会像水电煤气一样,成为我们生活中无处不在但又看不见的基础设施。你用AI生成有趣的朋友圈文字、看AI生成的视频、用AI助手处理工作,本质上都是在消费 Token。
二、Token工厂产业链拆解:谁在真正赚钱?
按照产业研究的通常做法,我们可以把Token工厂的产业链拆解成三大核心环节:
上游硬件基础设施(价值占比40%-45%)→ 中游算力运营与Token分发(价值占比25%-30%)→ 下游应用与场景(价值占比25%-30%)
1、上游:AI芯片、服务器、高速互联、液冷散热、电力与储能
这是Token工厂的物理基础,直接决定每瓦Token吞吐量的上限,也是当前技术迭代最密集、业绩确定性最强的环节,也是传统所谓“卖铲子”的环节。
| 细分环节 | 核心壁垒 | 市场格局 | 业绩确定性 |
|---|---|---|---|
| AI芯片 | 架构设计 + 制程工艺 + 软件生态(CUDA) | 英伟达绝对主导,国产昇腾追赶 | 极高(全球订单积压至2027年) |
| 服务器 | 大规模系统集成 + 液冷方案 | OEM厂商竞争激烈,头部集中 | 高(与GPU出货高度绑定) |
| 高速互联(光模块/CPO) | 800G→1.6T→CPO技术迭代 | 中国厂商全球份额领先 | 高(每代GPU升级都带动光模块换代) |
| 液冷散热 | 散热密度 + 系统可靠性 | 国内几家龙头优势明显 | 高(Vera Rubin为100%液冷系统) |
| 电力与储能 | 绿电资源 + 配电网 + 储能 | 地方电力公司 + 储能厂商 | 中高(电力审批是最大瓶颈) |
这个环节的核心特征是:大厂垄断 + 业绩确定性高。英伟达预测2026-2027年全球AI算力采购订单积压将突破1万亿美元。黄仁勋在GTC上甚至直言:”到2027年至少有1万亿美元的需求,我们甚至会供不应求。”这意味着上游订单至少能见度到2027年Q2。
但要注意,上游的业绩确定性也意味着预期差相对较小,股价往往已经充分包含了这些预期,想找到较大预期差的分支概念已经比较难了。
2、中游:智算中心运营、算力调度与优化、MaaS平台与Token交易
连接上游硬件与下游应用的核心环节,通过优化算法与调度策略提升每瓦Token吞吐量,也是正在价值重构的环节。 过去智算中心按卡时出租,毛利率20%-35%,本质上是重资产模式;现在通过算力调度、缓存复用、推理优化,同样的硬件可以产出更多Token,毛利率跳升至40%-60%,是长期利润池的核心。
推理优化是这个环节最硬核的技术壁垒。 欧洲AI新锐Nebius 2026年5月以6亿美元收购了一家仅20人的初创公司Eigen AI,就是为了获得其在模型量化、稀疏注意力等方面的推理优化技术。Semianalysis数据显示,当前推理模型的Token处理量已是之前的20倍,计算量是之前的150倍。
阿里成立ATH事业群、腾讯将MaaS平台升级为TokenHub、火山引擎日均Token使用量突破120万亿——三大巨头几乎在同一时间窗口集体向Token运营转型。
中游的投资价值在于”估值重构”——当市场按传统IDC或算力租赁给它20倍PE时,公司实际上正在转型为40%+毛利率的Token运营平台,这种认知差就是超额收益的来源。
智算中心运营(类似工厂主)
核心壁垒:算力规模、电力成本、运维能力
商业模式升级:从 “卖算力”(按卡按时长收费)转向 “卖 Token”(按产出收费)
毛利率提升:从传统 IDC 的20%-25%提升至Token工厂的50%以上
算力调度与优化(类似生产管理)
核心壁垒:全域算力调度能力、推理加速技术
价值:通过算法优化,可以在不增加硬件投入的情况下,将Token吞吐量提升30%-100%
代表:青云科技、网宿科技、润建股份(曲尺AI调度系统)
MaaS平台与Token交易(类似分销商)
核心壁垒:模型生态、客户资源、计费系统
商业模式:整合上游 Token 产能,打包成标准化服务卖给下游应用开发商
代表:阿里云、腾讯云、软通动力(黄埔一号 Token 工厂)
3、下游:大模型厂商、AI Agent、行业应用、终端硬件
下游就是”用Token创造价值的最后一环”。
高盛2026年5月发布的一份重磅报告给出了预测:到2030年,AI Agent将推动全球Token消耗量较2026年增长24倍,达到每月约120千万亿tokens。其中企业级Agent是最大推动力——2040年这一数字可能进一步扩大至55倍。
关键的逻辑转变是:AI Agent不是”按需聊天”——它是持续在线、多轮调用工具、反复验证结果的系统。高盛测算显示,普通聊天机器人每次会话约消耗1000个tokens,而持续在线的Agent每天可能超过10万个。
下游的投资逻辑是创造Token消耗场景的能力。豆包3.45亿月活用户、日均120万亿Token消耗量,背后是用量驱动收入的飞轮——谁能让用户多消耗Token,谁就能获得更大价值。而近期智谱、Anthropic、Kimi等头部模型相继涨价,也验证了”Token产品正在从烧钱获客走向量价齐升”的趋势。。
大模型厂商(Token 直接生产者)
它们既是 Token 的生产者,也是最大的消费者
代表:MiniMax、阶跃星辰、DeepSeek、科大讯飞
AI Agent(最大增量需求)
这是未来Token需求爆发的核心驱动力。一次简单的人机对话只消耗几十个Token,而一个AI Agent完成一次复杂任务(如写一份完整的商业计划书、分析一份财报)需要消耗数十万到百万Token。
5月7日,腾讯混元公布了一组数据:Hy3 preview上线仅两周,Token调用量就达到了上一代模型Hy2的10倍,其中代码和智能体类场景的增长更是超过了16.5 倍。
行业应用
金融、医疗、教育、政务、工业等行业的 AI 化,将带来持续的 Token 需求
代表:同花顺、恒生电子、卫宁健康、南威软件
4、产业链价值分布表
| 产业链环节 | 价值占比 | 核心壁垒 | 代表公司 |
|---|---|---|---|
| AI 芯片 | 15%-20% | 技术壁垒最高 | 英伟达、寒武纪、海光信息 |
| 服务器与光模块 | 15%-20% | 规模与供应链 | 浪潮信息、工业富联、中际旭创 |
| 液冷与电力 | 5%-10% | 资源与工程能力 | 英维克、协鑫能科 |
| 智算中心运营 | 10%-15% | 成本与规模 | 宝信软件、润建股份、鸿博股份 |
| MaaS 与 Token 交易 | 10%-15% | 生态与客户 | 阿里云、软通动力、弘信电子 |
| 大模型与应用 | 25%-30% | 场景与数据 | 科大讯飞、南威软件、平治信息 |
三、Token 工厂的投资逻辑:不同周期买不同的票
投资新兴产业最忌讳的就是 “一把梭”,Token工厂产业链的不同环节,在不同时间窗口的表现是完全不同的。
1、短期(1-3 个月):依然是卖铲人逻辑最强
核心逻辑:业绩兑现最明确,订单可见度最高。
- 光模块/CPO:英伟达Vera Rubin系统采用共封装光学交换机,铜缆+光纤+CPO三条路线并行扩产,每代GPU升级都带动互联技术换代。
- 服务器/液冷:Vera Rubin是100%液冷系统,2小时就能完成过去需要2天的机架安装。国内液冷解决方案商直接受益于新增产能的散热配套需求。
- AI芯片:国产替代逻辑清晰,但要注意技术迭代速度快、英伟达仍占主导的现实约束。
短期最大的变量是——订单能否转化为收入。 建议重点关注在手订单金额、客户结构、交付节奏三个指标。
2、中期(3-12个月):中游运营与MaaS平台的估值重构
这是预期差最大的环节。 核心逻辑是:市场还在按传统IDC或算力租赁估值,但这些公司正在向”Token运营平台”转型。
判断一家中游公司是否具有”估值重构”价值,可以看三个标准:
Token业务收入占比是否在快速提升(从算力租赁收入向Token分成收入切换)
是否具备自有调度/推理优化技术(不是简单买卡出租,而是有软件附加值)
合作方实力(是否绑定了大模型厂商或头部互联网公司的Token需求)
中游的本质是”连接算力供给与Token需求的调度中枢”,一旦形成规模效应,毛利率提升的斜率会很陡峭。按金山云等行业数据,高端GPU租金2026年Q1环比已上涨15%-30%。
3、长期(1年以上):下游AI Agent与行业应用
Token工厂最终的价值出口。 谁能创造更多Token消耗场景,谁就能获得最大价值。
AI Agent是最确定的增量来源。高盛指出,企业级Agent目前真正大规模部署的不到25%,主要还集中在客服、IT运维、销售支持等领域,且大多是”Copilot辅助”而非完全自主Agent。随着Agent从辅助走向自主,Token消耗将出现数量级跃升。
但这个环节的不确定性也最大——商业模式仍在探索中,大量公司还在用烧钱换规模。
4、电力成本是一条贯穿所有时间轴的暗线
电力成本占Token运营成本的60%-70%,这是Token工厂最容易被忽视的约束条件。一座数据中心的配电功率审批后就基本固定,扩张需要重新走审批流程,周期很长。这意味着,拥有廉价绿电资源(如西部水电、光伏+储能)的企业,将获得难以复制的长期成本优势。 内蒙古、贵州、宁夏等西部省份的大型智算中心,在这方面具备天然优势。
四、核心企业梳理:按受益确定性排序
按照项目落地进度 > 业绩兑现确定性 > 行业地位与壁垒 > 合作方实力 > 估值合理性的标准,我们将核心标的分为三个梯队。
1、第一梯队(确定性最高):项目已投产/即将投产,业绩已开始兑现
核心特征:有明确的已投产Token工厂或智算中心,订单可见,收入结构中Token相关业务开始贡献比例。
头部云厂商(阿里、腾讯、字节):阿里已成立ATH事业群,腾讯今年AI投入将翻倍至360亿以上,字节火山引擎日均Token量突破120万亿。它们是中游最大的运营商,也是最直接受益于Token经济爆发的玩家。
核心催化剂:Token业务收入占比提升(从个位数向20%+爬升)、Token调用量持续超预期。
关键风险:资本开支压力大,毛利率改善节奏可能不及预期。
已落地Token工厂的智算中心运营商:中贝通信已运营算力规模超17000P,为金山云等提供智算服务。协创数据累计拟投入212亿元采购高算力服务器,大规模布局算力集群。
核心催化剂:新建Token工厂投产公告、大客户签约。
关键风险:算力利用率不及预期、客户集中度风险。
2、第二梯队(高确定性):有官方签约项目,合作方实力强,业绩3-6个月内有望兑现
核心特征:与头部大模型厂商或互联网平台有明确的Token工厂合作或签约,布局清晰。
Token工厂基建与散热配套商:Vera Rubin全面液冷化带动国内液冷方案商进入英伟达生态链。关注有液冷数据中心交付案例、与头部GPU厂商有合作关系的公司。
核心催化剂:英伟达Vera Rubin交付放量、国内大型Token工厂基建招标。
关键风险:产品认证周期长、竞争对手跟进速度快。
算力调度与MaaS平台:九章云极推出Token Factory平台并首家通过信通院标准评估,天云数据发布TokenFactory与TokenRouter产品。
核心催化剂:信通院Token工厂评估结果公布、头部客户签约。
关键风险:行业尚处早期,商业模式需时间验证。
地方Token工厂示范项目:云天励飞发布全国首个”国模+国芯Token工厂”方案,面向湛江区域推理应用。云天励飞强调,推理芯片、Token工厂与智能体将共同构成AI规模化落地的重要支撑。
核心催化剂:项目投产运行、Token产量数据公布。
关键风险:国产芯片性能瓶颈、客户拓展进展不确定。
3、第三梯队(中等确定性):有明确布局但业绩兑现需6个月以上
核心特征:业务相关,在产业链上有卡位,但Token工厂业务尚未贡献实质性收入。
AI Agent应用厂商:科大讯飞依托星火大模型在教育、医疗、办公等场景探索变现可能。需持续跟踪Token消耗量增长与付费转化率的改善。
存储芯片:TrendForce预测2026年Q2 DRAM合约价上涨58%-63%,NAND Flash上涨70%-75%,AI基础设施投资激增引发结构性供需失衡。
特别提醒:不同投资者应根据自身风险偏好和投资周期选择标的,这篇文章只讲逻辑、不荐股。第一梯队胜在确定性高,但估值可能不便宜、预期可能已经在股价里;第三梯队潜在空间大,但业绩兑现的不确定性也高。
五、催化事件与风险提示
1、未来6个月内可能的核心催化事件(按时间顺序)
- 2026年Q2-Q3:英伟达Vera Rubin首批机架交付(已在微软Azure运行),国内液冷/服务器/光模块厂商订单确认收入
- 2026年Q3:英伟达Groq LPU推理芯片出货,推理侧Token生产成本将进一步下降
- 2026年H2:DeepSeek V4与华为昇腾超节点深度适配,国产Token工厂供应链逻辑进一步验证
- 全年:各大云厂商季度财报中Token业务收入占比变化,是跟踪产业进度的最直接指标
- 全年:中国信通院Token工厂全栈服务能力评估结果公布,产业标准逐步建立
2、四大必须讲清楚的风险
风险一:技术迭代风险。 英伟达已提前两年曝光Feynman架构(1.6nm制程),芯片迭代速度持续加快。这意味着今天投资建设的Token工厂,其硬件可能在3年内面临代际淘汰压力。企业在算力资产折旧与技术升级之间需要持续做选择题。
风险二:电力供给瓶颈。 这是Token工厂产能扩张的最大制约因素,没有之一。一座1GW的数据中心永远不可能扩容到2GW。中国西部虽然电力相对充裕,但东部沿海才是Token需求最集中的区域,配电网和跨区输电能力是硬约束。那些”规划中”的Token工厂项目,能否真正拿到配电指标才是关键。
风险三:行业竞争加剧。 算力租赁价格2026年Q1上涨15%-30%,给了中游环节短期利润弹性,但也吸引了大量资本涌入。随着新产能逐步释放,2027年可能出现阶段性供给过剩。Token工厂的竞争终局,是少数具备技术优化能力和规模优势的头部玩家通吃。
风险四:政策与监管风险。 Token作为新的计价单位,其定价机制、数据安全、跨境流动等方面尚无明确的监管框架。虽然中国信通院已启动Token工厂评估标准制定,工信部也推出了算力普惠专项行动,但政策的不确定性依然需要纳入考量。
总结:Token工厂的投资方法论
Token工厂不是算力租赁的新马甲,而是AI产业商业模式的根本性重构——从”卖算力”到”卖智能产出”。它的核心逻辑可以用三句话概括:
上游看订单确定性——只要全球Token工厂还在扩建,硬件需求就不会断。
中游看模式升级——从算力租赁向Token运营转型,毛利率弹性最大。
下游看消耗场景——AI Agent是Token需求最大的增量来源,但变现路径有待验证。
最后,给大家一套可以自己持续跟踪分析的指标体系:
每瓦Token吞吐量:衡量Token工厂生产效率的核心指标,决定成本竞争力。
算力出租率:实际使用算力/总算力,衡量智算中心利用率的关键指标,高于85%说明需求旺盛、低于50%说明产能过剩。
Token业务收入占比:衡量企业转型进度的核心指标,即 Token相关收入/总收入
电力支出占比及趋势:衡量企业长期竞争力的基础指标,越低越好,区域优势的量化指标。
VCAI.CN 原创文章,转载请注明出处:https://vcai.cn/index.php/zhuti-tokengongchang/
