Token工厂:AI产业的下一个十年,从 “卖算力” 到 “卖智能”

2026年3月16日,英伟达GTC大会上,黄仁勋在长达两个半小时的演讲中,70多次提到同一个词——”Token工厂”。他把数据中心重新定义为”生产智能代币的工厂”,并断言:”吞吐量和Token生成速度,将直接转化为你明年的精确收入。”与此同时,阿里成立了由CEO吴泳铭直接挂帅的ATH事业群,腾讯总裁刘炽平表态今年AI投入将翻倍至360亿元以上。

如果你只是把这当作又一个炒作概念,可能会错过一次产业级的范式迁移。

用最简单的话解释Token工厂:过去AI公司比拼的是谁能囤更多GPU,就像挖矿时代比谁的矿机多;但现在,行业进入了”卖电力”的阶段——谁能在单位电力消耗下产出更多Token,谁就能赚钱。 Token就是大模型处理信息的最小单位,你让AI写一段话、生成一张图、完成一次推理,背后都是以Token为单位在消耗算力。国家数据局数据显示,中国日均Token调用量已从2024年初的1000亿飙升至2026年3月的140万亿,两年增长超千倍。

这背后是AI产业商业模式即将发生的根本性变革。过去两年,我们经历的是 “模型军备竞赛”,比拼的是谁的参数更多、谁的模型更大;那么从现在开始,行业已经全面进入 “Token产能竞赛” 时代。

这篇文章将用成熟的研究框架,帮你理解:为什么数据中心正在从”存储仓库”变成”智能工厂”?产业链上哪些环节在真正赚钱?不同投资周期应该关注什么样的标的? 这是一套可以至少关注6个月的投研地图,而不是一张一次性的投机清单。

一、Token工厂的核心本质:不是算力租赁的新名字

很多人把 Token 工厂简单理解为算力租赁的新马甲,这是一个根本性的误解。

精准定义

Token工厂是一种全新的 AI 基础设施形态,它将数据中心从传统的 “电子仓库”(存储与算力载体),转型为24小时不间断生产智能的 “数字工厂”。

它的核心生产公式是:

电力输入 + 算力集群 + 算法优化 → 标准化智能输出(Token)

1、Token工厂与传统算力租赁的本质区别

这不是换个名字那么简单,而是从商业模式到核心竞争力的全面重构:

对比维度传统算力租赁Token 工厂
商业模式卖硬件时间(按卡 / 按时长收费)卖智能产品(按 Token 数量 / 质量收费)
毛利率20%-25%50% 以上
核心壁垒卡的数量、机柜规模每瓦 Token 吞吐量、算法优化能力
盈利逻辑硬件差价 + 运维服务费Token 分成 + 增值服务
行业阶段成熟竞争,价格战激烈爆发初期,格局尚未形成
客户粘性低,谁便宜就买谁的高,绑定模型与应用生态

算力租赁赚的是”地租”,Token工厂赚的是”制造利润”。 前者比的是谁有资源拿到卡,后者比的是谁能把一张卡用出两张卡的效果。九章云极的数据很能说明问题:当前企业GPU利用率普遍低于30%,也就是说100万元的算力投资,实际发挥作用的只有30万,剩下70万”买的是等待”。Token工厂通过资源池化与异构算力统一纳管,可以将利用率提升至85%以上。

2、为什么 “每瓦Token吞吐量” 是AI时代最重要的KPI?

黄仁勋在 GTC 大会上反复强调:”每一座数据中心、每一座工厂,从定义上来说都是受电力限制的。一座 1GW 的工厂永远不会变成 2GW,这是物理和原子的定律。”

在电力约束刚性(一座数据中心的配电容量审批后就固定了)的前提下,谁能从每一瓦特电力中挤出更多Token,谁就拥有更低的单位成本和最强的定价权。红杉资本也明确指出,GPU计算正日益商品化,充裕且低成本的算力已成为支撑数字经济运转的基础设施。

这就是为什么 “服务器数量”、”GPU 卡数” 这些传统指标已经过时了。同样是1万张H100卡,优化得好的Token工厂每瓦Token吞吐量可能是优化得差的2-3 倍,这意味着前者的毛利率可以达到60%,而后者可能连20%都不到。

3、Token:AI时代的 “硬通货”

Token之所以不只是”算力的另一种叫法”,是因为它具备了可计量、可定价、可交易三大特征。国家数据局局长刘烈宏将其定义为”智能时代的价值锚点”,是连接技术供给与商业需求的”结算单位”。

Token是AI处理信息的最小语义单元,1Token≈0.75个英文单词≈1.35个汉字。

但它的价值远不止于此:

  • 它是AI服务的最小标准化计价单元,所有大模型API都是按Token收费
  • 它是AI产业的通用结算货币,模型厂商、云服务商、应用开发商之间都用Token结算
  • 它是可分层定价的商品,黄仁勋将 AI 服务分为五个商业层级:

免费层:高吞吐、低速度,用于吸引用户

中级层:约每百万 Token 3 美元,用于普通对话

高级层:约每百万 Token 6 美元,用于复杂推理

高速层:约每百万 Token 45 美元,用于实时响应

超高速层:约每百万 Token 150 美元,用于高频交易等对延迟要求极高的场景

这意味着,Token的价值不是平均分布的——越”聪明”的Token越值钱。模型越大、上下文越长、推理越深,每个Token的溢价空间就越大。未来,Token会像水电煤气一样,成为我们生活中无处不在但又看不见的基础设施。你用AI生成有趣的朋友圈文字、看AI生成的视频、用AI助手处理工作,本质上都是在消费 Token。

二、Token工厂产业链拆解:谁在真正赚钱?

按照产业研究的通常做法,我们可以把Token工厂的产业链拆解成三大核心环节:

上游硬件基础设施(价值占比40%-45%)→ 中游算力运营与Token分发(价值占比25%-30%)→ 下游应用与场景(价值占比25%-30%)

1、上游:AI芯片、服务器、高速互联、液冷散热、电力与储能

这是Token工厂的物理基础,直接决定每瓦Token吞吐量的上限,也是当前技术迭代最密集、业绩确定性最强的环节,也是传统所谓“卖铲子”的环节。

细分环节核心壁垒市场格局业绩确定性
AI芯片架构设计 + 制程工艺 + 软件生态(CUDA)英伟达绝对主导,国产昇腾追赶极高(全球订单积压至2027年)
服务器大规模系统集成 + 液冷方案OEM厂商竞争激烈,头部集中高(与GPU出货高度绑定)
高速互联(光模块/CPO)800G→1.6T→CPO技术迭代中国厂商全球份额领先高(每代GPU升级都带动光模块换代)
液冷散热散热密度 + 系统可靠性国内几家龙头优势明显高(Vera Rubin为100%液冷系统)
电力与储能绿电资源 + 配电网 + 储能地方电力公司 + 储能厂商中高(电力审批是最大瓶颈)

这个环节的核心特征是:大厂垄断 + 业绩确定性高。英伟达预测2026-2027年全球AI算力采购订单积压将突破1万亿美元。黄仁勋在GTC上甚至直言:”到2027年至少有1万亿美元的需求,我们甚至会供不应求。”这意味着上游订单至少能见度到2027年Q2。

但要注意,上游的业绩确定性也意味着预期差相对较小,股价往往已经充分包含了这些预期,想找到较大预期差的分支概念已经比较难了。

2、中游:智算中心运营、算力调度与优化、MaaS平台与Token交易

连接上游硬件与下游应用的核心环节,通过优化算法与调度策略提升每瓦Token吞吐量,也是正在价值重构的环节。 过去智算中心按卡时出租,毛利率20%-35%,本质上是重资产模式;现在通过算力调度、缓存复用、推理优化,同样的硬件可以产出更多Token,毛利率跳升至40%-60%,是长期利润池的核心。

推理优化是这个环节最硬核的技术壁垒。 欧洲AI新锐Nebius 2026年5月以6亿美元收购了一家仅20人的初创公司Eigen AI,就是为了获得其在模型量化、稀疏注意力等方面的推理优化技术。Semianalysis数据显示,当前推理模型的Token处理量已是之前的20倍,计算量是之前的150倍。

阿里成立ATH事业群、腾讯将MaaS平台升级为TokenHub、火山引擎日均Token使用量突破120万亿——三大巨头几乎在同一时间窗口集体向Token运营转型。

中游的投资价值在于”估值重构”——当市场按传统IDC或算力租赁给它20倍PE时,公司实际上正在转型为40%+毛利率的Token运营平台,这种认知差就是超额收益的来源。

智算中心运营(类似工厂主)

核心壁垒:算力规模、电力成本、运维能力

商业模式升级:从 “卖算力”(按卡按时长收费)转向 “卖 Token”(按产出收费)

毛利率提升:从传统 IDC 的20%-25%提升至Token工厂的50%以上

算力调度与优化(类似生产管理)

核心壁垒:全域算力调度能力、推理加速技术

价值:通过算法优化,可以在不增加硬件投入的情况下,将Token吞吐量提升30%-100%

代表:青云科技、网宿科技、润建股份(曲尺AI调度系统)

MaaS平台与Token交易(类似分销商)

核心壁垒:模型生态、客户资源、计费系统

商业模式:整合上游 Token 产能,打包成标准化服务卖给下游应用开发商

代表:阿里云、腾讯云、软通动力(黄埔一号 Token 工厂)

3、下游:大模型厂商、AI Agent、行业应用、终端硬件

下游就是”用Token创造价值的最后一环”。

高盛2026年5月发布的一份重磅报告给出了预测:到2030年,AI Agent将推动全球Token消耗量较2026年增长24倍,达到每月约120千万亿tokens。其中企业级Agent是最大推动力——2040年这一数字可能进一步扩大至55倍。

关键的逻辑转变是:AI Agent不是”按需聊天”——它是持续在线、多轮调用工具、反复验证结果的系统。高盛测算显示,普通聊天机器人每次会话约消耗1000个tokens,而持续在线的Agent每天可能超过10万个。

下游的投资逻辑是创造Token消耗场景的能力。豆包3.45亿月活用户、日均120万亿Token消耗量,背后是用量驱动收入的飞轮——谁能让用户多消耗Token,谁就能获得更大价值。而近期智谱、Anthropic、Kimi等头部模型相继涨价,也验证了”Token产品正在从烧钱获客走向量价齐升”的趋势。。

大模型厂商(Token 直接生产者)

它们既是 Token 的生产者,也是最大的消费者

代表:MiniMax、阶跃星辰、DeepSeek、科大讯飞

AI Agent(最大增量需求)

这是未来Token需求爆发的核心驱动力。一次简单的人机对话只消耗几十个Token,而一个AI Agent完成一次复杂任务(如写一份完整的商业计划书、分析一份财报)需要消耗数十万到百万Token。

5月7日,腾讯混元公布了一组数据:Hy3 preview上线仅两周,Token调用量就达到了上一代模型Hy2的10倍,其中代码和智能体类场景的增长更是超过了16.5 倍。

行业应用

金融、医疗、教育、政务、工业等行业的 AI 化,将带来持续的 Token 需求

代表:同花顺、恒生电子、卫宁健康、南威软件

4、产业链价值分布表

产业链环节价值占比核心壁垒代表公司
AI 芯片15%-20%技术壁垒最高英伟达、寒武纪、海光信息
服务器与光模块15%-20%规模与供应链浪潮信息、工业富联、中际旭创
液冷与电力5%-10%资源与工程能力英维克、协鑫能科
智算中心运营10%-15%成本与规模宝信软件、润建股份、鸿博股份
MaaS 与 Token 交易10%-15%生态与客户阿里云、软通动力、弘信电子
大模型与应用25%-30%场景与数据科大讯飞、南威软件、平治信息

三、Token 工厂的投资逻辑:不同周期买不同的票

投资新兴产业最忌讳的就是 “一把梭”,Token工厂产业链的不同环节,在不同时间窗口的表现是完全不同的。

1、短期(1-3 个月):依然是卖铲人逻辑最强

核心逻辑:业绩兑现最明确,订单可见度最高。

  • 光模块/CPO:英伟达Vera Rubin系统采用共封装光学交换机,铜缆+光纤+CPO三条路线并行扩产,每代GPU升级都带动互联技术换代。
  • 服务器/液冷:Vera Rubin是100%液冷系统,2小时就能完成过去需要2天的机架安装。国内液冷解决方案商直接受益于新增产能的散热配套需求。
  • AI芯片:国产替代逻辑清晰,但要注意技术迭代速度快、英伟达仍占主导的现实约束。

短期最大的变量是——订单能否转化为收入。 建议重点关注在手订单金额、客户结构、交付节奏三个指标。

2、中期(3-12个月):中游运营与MaaS平台的估值重构

这是预期差最大的环节。 核心逻辑是:市场还在按传统IDC或算力租赁估值,但这些公司正在向”Token运营平台”转型。

判断一家中游公司是否具有”估值重构”价值,可以看三个标准:

Token业务收入占比是否在快速提升(从算力租赁收入向Token分成收入切换)

是否具备自有调度/推理优化技术(不是简单买卡出租,而是有软件附加值)

合作方实力(是否绑定了大模型厂商或头部互联网公司的Token需求)

中游的本质是”连接算力供给与Token需求的调度中枢”,一旦形成规模效应,毛利率提升的斜率会很陡峭。按金山云等行业数据,高端GPU租金2026年Q1环比已上涨15%-30%。

3、长期(1年以上):下游AI Agent与行业应用

Token工厂最终的价值出口。 谁能创造更多Token消耗场景,谁就能获得最大价值。

AI Agent是最确定的增量来源。高盛指出,企业级Agent目前真正大规模部署的不到25%,主要还集中在客服、IT运维、销售支持等领域,且大多是”Copilot辅助”而非完全自主Agent。随着Agent从辅助走向自主,Token消耗将出现数量级跃升。

但这个环节的不确定性也最大——商业模式仍在探索中,大量公司还在用烧钱换规模。

4、电力成本是一条贯穿所有时间轴的暗线

电力成本占Token运营成本的60%-70%,这是Token工厂最容易被忽视的约束条件。一座数据中心的配电功率审批后就基本固定,扩张需要重新走审批流程,周期很长。这意味着,拥有廉价绿电资源(如西部水电、光伏+储能)的企业,将获得难以复制的长期成本优势。 内蒙古、贵州、宁夏等西部省份的大型智算中心,在这方面具备天然优势。

四、核心企业梳理:按受益确定性排序

按照项目落地进度 > 业绩兑现确定性 > 行业地位与壁垒 > 合作方实力 > 估值合理性的标准,我们将核心标的分为三个梯队。

1、第一梯队(确定性最高):项目已投产/即将投产,业绩已开始兑现

核心特征:有明确的已投产Token工厂或智算中心,订单可见,收入结构中Token相关业务开始贡献比例。

头部云厂商(阿里、腾讯、字节):阿里已成立ATH事业群,腾讯今年AI投入将翻倍至360亿以上,字节火山引擎日均Token量突破120万亿。它们是中游最大的运营商,也是最直接受益于Token经济爆发的玩家。

核心催化剂:Token业务收入占比提升(从个位数向20%+爬升)、Token调用量持续超预期。

关键风险:资本开支压力大,毛利率改善节奏可能不及预期。

已落地Token工厂的智算中心运营商:中贝通信已运营算力规模超17000P,为金山云等提供智算服务。协创数据累计拟投入212亿元采购高算力服务器,大规模布局算力集群。

核心催化剂:新建Token工厂投产公告、大客户签约。

关键风险:算力利用率不及预期、客户集中度风险。

2、第二梯队(高确定性):有官方签约项目,合作方实力强,业绩3-6个月内有望兑现

核心特征:与头部大模型厂商或互联网平台有明确的Token工厂合作或签约,布局清晰。

Token工厂基建与散热配套商:Vera Rubin全面液冷化带动国内液冷方案商进入英伟达生态链。关注有液冷数据中心交付案例、与头部GPU厂商有合作关系的公司。

核心催化剂:英伟达Vera Rubin交付放量、国内大型Token工厂基建招标。

关键风险:产品认证周期长、竞争对手跟进速度快。

算力调度与MaaS平台:九章云极推出Token Factory平台并首家通过信通院标准评估,天云数据发布TokenFactory与TokenRouter产品。

核心催化剂:信通院Token工厂评估结果公布、头部客户签约。

关键风险:行业尚处早期,商业模式需时间验证。

地方Token工厂示范项目:云天励飞发布全国首个”国模+国芯Token工厂”方案,面向湛江区域推理应用。云天励飞强调,推理芯片、Token工厂与智能体将共同构成AI规模化落地的重要支撑。

核心催化剂:项目投产运行、Token产量数据公布。

关键风险:国产芯片性能瓶颈、客户拓展进展不确定。

3、第三梯队(中等确定性):有明确布局但业绩兑现需6个月以上

核心特征:业务相关,在产业链上有卡位,但Token工厂业务尚未贡献实质性收入。

AI Agent应用厂商:科大讯飞依托星火大模型在教育、医疗、办公等场景探索变现可能。需持续跟踪Token消耗量增长与付费转化率的改善。

存储芯片:TrendForce预测2026年Q2 DRAM合约价上涨58%-63%,NAND Flash上涨70%-75%,AI基础设施投资激增引发结构性供需失衡。

五、催化事件与风险提示

1、未来6个月内可能的核心催化事件(按时间顺序)

  • 2026年Q2-Q3:英伟达Vera Rubin首批机架交付(已在微软Azure运行),国内液冷/服务器/光模块厂商订单确认收入
  • 2026年Q3:英伟达Groq LPU推理芯片出货,推理侧Token生产成本将进一步下降
  • 2026年H2:DeepSeek V4与华为昇腾超节点深度适配,国产Token工厂供应链逻辑进一步验证
  • 全年:各大云厂商季度财报中Token业务收入占比变化,是跟踪产业进度的最直接指标
  • 全年:中国信通院Token工厂全栈服务能力评估结果公布,产业标准逐步建立

2、四大必须讲清楚的风险

风险一:技术迭代风险。 英伟达已提前两年曝光Feynman架构(1.6nm制程),芯片迭代速度持续加快。这意味着今天投资建设的Token工厂,其硬件可能在3年内面临代际淘汰压力。企业在算力资产折旧与技术升级之间需要持续做选择题。

风险二:电力供给瓶颈。 这是Token工厂产能扩张的最大制约因素,没有之一。一座1GW的数据中心永远不可能扩容到2GW。中国西部虽然电力相对充裕,但东部沿海才是Token需求最集中的区域,配电网和跨区输电能力是硬约束。那些”规划中”的Token工厂项目,能否真正拿到配电指标才是关键。

风险三:行业竞争加剧。 算力租赁价格2026年Q1上涨15%-30%,给了中游环节短期利润弹性,但也吸引了大量资本涌入。随着新产能逐步释放,2027年可能出现阶段性供给过剩。Token工厂的竞争终局,是少数具备技术优化能力和规模优势的头部玩家通吃。

风险四:政策与监管风险。 Token作为新的计价单位,其定价机制、数据安全、跨境流动等方面尚无明确的监管框架。虽然中国信通院已启动Token工厂评估标准制定,工信部也推出了算力普惠专项行动,但政策的不确定性依然需要纳入考量。

总结:Token工厂的投资方法论

Token工厂不是算力租赁的新马甲,而是AI产业商业模式的根本性重构——从”卖算力”到”卖智能产出”。它的核心逻辑可以用三句话概括:

上游看订单确定性——只要全球Token工厂还在扩建,硬件需求就不会断。

中游看模式升级——从算力租赁向Token运营转型,毛利率弹性最大。

下游看消耗场景——AI Agent是Token需求最大的增量来源,但变现路径有待验证。

最后,给大家一套可以自己持续跟踪分析的指标体系:

每瓦Token吞吐量:衡量Token工厂生产效率的核心指标,决定成本竞争力。

算力出租率:实际使用算力/总算力,衡量智算中心利用率的关键指标,高于85%说明需求旺盛、低于50%说明产能过剩。

Token业务收入占比:衡量企业转型进度的核心指标,即 Token相关收入/总收入

电力支出占比及趋势:衡量企业长期竞争力的基础指标,越低越好,区域优势的量化指标。

VCAI.CN 原创文章,转载请注明出处:https://vcai.cn/index.php/zhuti-tokengongchang/

(0)
v形反转的头像v形反转
涨停复盘20260507:AI、机器人
上一篇 4天前
涨停复盘20260508:AI、机器人
下一篇 1天前

相关推荐

发表回复

登录后才能评论

关注微信

2022042007343997