Administrator
Published on 2026-05-16 / 5 Visits
0
0

Token 是新时代的盐铁

200 毫秒环游地球

一笔 SWIFT 跨境转账需要一到五个工作日。一次 token API 调用,从你在地球这端发出 prompt 到那端完成推理并把结果传回你的屏幕,大约需要 200 毫秒到 2 秒。差了五到六个数量级。

这个差距不是技术冷知识,而是一个结构性断裂。每一次你向 GPT-5.5、Claude 或 DeepSeek 发送 prompt,你都在参与一笔交易:跨越国境、把货币转化为智能、交付可用的生产力产出,而这一切在你的手指离开 Enter 键之前就完成了。没有海关官员检查它,没有央行清算它,没有外汇交易台碰它。

这笔交易的计量单位是 token。是时候认真理解它到底意味着什么了。

盐铁、石油、法币:战略资源的谱系

每个时代都有一个基础性资源,控制了它就等于控制了经济命脉。控制了资源,就控制了税基、军备和权力分配。

在汉代,这个资源是盐和铁。汉武帝在桑弘羊的建议下,于公元前 119 年将两业收归国有。逻辑很直接:盐是食物保存的必需品,铁是农业和军事的必需品。民间商人囤积居奇,而国家对匈奴作战需要财政支撑。专卖制度养活了一个帝国,也引发了一场持续两千年的经济思想辩论,即公元前 81 年的盐铁会议。

在二十世纪,这个资源是石油。石油不仅点灯,还驱动军舰、坦克和飞机,使其从大宗商品变成了战略资产。对石油供应的控制塑造了二战格局,催生了 OPEC,锚定了石油美元体系,推动了从中东到南海数十年的地缘博弈。

在后布雷顿森林体系时代,这个资源是法币本身。发行储备货币的能力给了美国戴高乐所称的"过分的特权":印出来的钱,全世界必须持有。货币主权成为战略资源控制的终极形式。

Token 同时具备这三者的特征,外加一个它们都不具备的属性:以光速移动。

时代 战略资源 控制手段 分配机制 流转速度
汉代 盐铁 国家专卖 政府定价 数周(商队)
20 世纪 石油 OPEC + 石油美元 市场 + 地缘博弈 数天(油轮)
1971 年后 储备货币 央行 + 军事霸权 银行体系(SWIFT) 1-5 天
AI 时代 Token 模型权重 + 算力 API 定价 200ms

每一代都在提高控制的抽象层级。盐铁是物理商品,在矿场和作坊扣押即可。石油是物理商品但通过金融工具交易。法币是纯粹抽象,以国家权力背书。Token 也是抽象,但以算法能力背书:一个 token 的"信用"不来自政府的资产负债表,而来自产生它的模型的质量。GPT-5.5 的 token 比 GPT-4 贵,是因为模型更强,不是因为哪个中央权威规定了价格。

Token 的逃逸速度

这就是 token 与历史上所有战略资源分道扬镳的地方:它能绕过一切控制盐、石油和货币的治理机制。

想象一个美国开发者想用 DeepSeek。DeepSeek 的 API 以人民币计价,托管在中国基础设施上。开发者无法直接用美元支付。于是他通过 API 中转服务购买访问:第三方代理接受美元,通过自己的基础设施路由请求,在后端用人民币向 DeepSeek 付款。

从开发者的角度看,他花了美元,得到了智能。从 DeepSeek 的角度看,它从国内合作伙伴那里赚了人民币。美元没有进入中国的外汇体系,人民币没有流出中国。但经济价值在 200 毫秒内跨越了地缘边界。

这不是假设。2026 年,中国开发者通过 shadow API 代理服务器访问 Claude 和 GPT-5.5,美国开发者通过中转服务访问中国模型。模式完全相同。而这些中转服务的结构并不新鲜,它在功能上就是清代山西票号的创新:你在北京存银子,拿到一张银票,在太原凭票取银。银子没有移动,但价值转移了。

历史对应 Token 时代对应
实体白银 GPU 算力(物理资源)
银票 API Key / Token 额度
山西票号 API 中转站
清政府对票号的监管困境 各国对 token 流转的监管困境
最终方案:央行统一发行法币 Token 时代的"央行"尚未出现

最后一行是关键洞察。治理 token 流转的制度基础设施还没有被建造出来。它一定会被建造,因为历史上每一种战略资源最终都获得了治理层。盐有了国家专卖,石油有了 OPEC,货币有了央行。Token 也会有类似的制度。问题在于它以什么形态出现,以及谁先建造它。

Token 本位:双极世界

截至 2026 年,前沿模型的生产能力集中在中美两国。美国有 OpenAI、Anthropic、Google、Meta、xAI。中国有 DeepSeek、阿里(Qwen)、字节跳动和国家支持的生态。没有任何其他国家或地区同时具备模型训练能力和算力基础设施来大规模生产前沿级别的 token。

这不仅是技术差距,而是 token 经济体的结构性特征,映射了 21 世纪初的地缘格局。

Token 的产业链条:

芯片设计 → 制造 → 数据中心 → 模型训练 → API 服务 → 终端用户
(NVIDIA/   (TSMC)  (云厂商)    (OpenAI,    (定价)    (消费)
 华为)                        DeepSeek等)

美国控制芯片设计(NVIDIA、AMD),依托台积电作为制造伙伴。中国正在建设国产替代(华为昇腾、中芯国际),同时应对美国出口管制对先进制程的限制。2026 年 1 月,美国商务部工业与安全局(BIS)修订了对 H200 和 MI325X 出口中国的规则,从"推定拒绝"转为有条件的逐案审批。

但芯片出口管制不等于 token 出口管制。在俄勒冈州用 NVIDIA H100 训练出的模型,可以给地球上任何 IP 地址提供 token 服务。在深圳用华为昇腾 910B 训练出的模型,同样如此。战略资源不是芯片,而是芯片帮助生产的 token。而 token 如我们所见,逃逸了让芯片出口管制得以执行的物理约束。

如果以"token 本位"来思考,类似金本位或美元本位,其影响是深远的。

Token 生产者是事实上的货币当局。 当 OpenAI 把 GPT-5.5 从每百万输入 token 15 美元降到 5 美元时,全球所有使用 GPT-5.5 的企业同时经历了成本下降。这在功能上等同于央行降息。以 token 计价的全球"生产成本"瞬间降低。但与美联储的利率决策不同,后者需要 FOMC 会议、国会监督和数月的前瞻指引,OpenAI 的定价调整只需要一篇博客文章。一个公司,一个决定,全球冲击。

Token 价格的下跌速度超过摩尔定律。 2024 到 2026 年间,同等智能的成本下降了 90-97%。DeepSeek V4 每百万 token 收费 0.30/0.50 美元(输入/输出),而 Claude Sonnet 4.6 是 3/5 美元。最便宜的前沿模型比最贵的旗舰模型便宜 42 倍。这种通缩压力是一种生产力扩张,传统货币经济学对此没有分析框架。当智能(所有生产活动最基础的投入品)的成本在两年内下降了两个数量级,"通胀"这个概念需要重新定义。

Token 进口国面临新的依赖。 每一个没有前沿模型能力的国家都是 token 净进口国。它们从中美供应商那里购买智能,以美元或人民币支付。资本流出是真实的,但不会出现在传统贸易统计中,因为 token 被归类为数字服务而非大宗商品。一个进口 90% 石油的国家清楚自己的脆弱性。一个进口 90% AI token 的国家可能甚至没有意识到这种依赖。

治理悖论

这就是 token 时代的核心张力,而且是真实的张力,不是逻辑矛盾。

Token 必须被治理。任何战略重要性达到这种级别的资源最终都会吸引国家监管,因为国家不可能放弃对决定军事能力、经济生产力和信息主权的东西的控制权。中国对模型的备案要求和内容审查是治理的一种形式,欧盟的 AI Act 是另一种,美国以芯片出口管制和数据隐私为重点的做法是第三种。

但 token 抵抗治理。它的逃逸速度,即通过代理服务绕过地理和金融边界的能力,使其天然比物理商品甚至传统金融流更难监管。你无法在 HTTPS 请求上设海关检查站。你无法像冻结银行账户一样冻结 token 钱包,因为不存在钱包:只有一个存在 200 毫秒的无状态 API 调用。

这形成了一个治理悖论:token 越重要就越难管控,越难管控就越需要管控。

历史上的先例具有启发性。汉代的盐铁专卖并非一夜之间实现。它是法家技术官僚(主张国家控制)和儒家改革派(主张自由市场)之间数十年辩论的结果。公元前 81 年的盐铁会议是这场辩论的记录。花了几代人的时间才找到平衡国家财政和市场效率的治理模式。

Token 处于同一周期的早期阶段。当前的监管方式,芯片出口管制、模型备案、内容审查,是用旧工具解决新问题的产物。它们瞄准物理基底(芯片)或产出物(生成内容),而非资源本身(token)。这就好比汉代试图通过控制谁拥有铁锅来管制盐铁。

Token 的治理锚点最可能落在 API 服务和中转层,而非芯片或模型层。这是 token 流转变得可观测、可监管的地方。历史先例是山西票号向现代商业银行的演变:不是禁止流动,而是许可中间商。未来的"token 结算体系"可能要求中转服务持有牌照、维持算力准备金、报告跨境 token 流量,类似于现代银行通过 SWIFT 报告跨境资本流动。

但这个体系目前不存在。在它出现之前,token 会继续以光速穿越国界,承载经济价值和生产力智能,对那些为管制商品和货币流动而设计的制度而言,它是隐形的。

如果桑弘羊活到现在

桑弘羊,盐铁专卖制度的缔造者,理解一个根本道理:谁控制了一个时代的战略资源,谁就控制了这个时代的权力分配。他不是在做道德论证,而是在做结构论证。

如果他活在今天,他会立刻认出这个模式:一种普遍需要的资源,生产高度集中,对经济产出和军事能力都至关重要。少数生产者可以定价,从而影响所有其他经济活动的成本结构。依赖这种资源的大众对它的生产和分配既没有可见性也没有控制权。

他可能也会认出治理的难度。盐铁专卖之所以可行,是因为盐矿和铁坊是物理资产,可以被查封。Token 没有物理形态。生产设施(数据中心)可以位于任何地方。分发机制(API)可以被代理和中转。消费者(任何有互联网连接的人)可以从任何司法管辖区接入。

问题没有变,解空间的前提条件已经完全不同。而最终将治理 token 生产和分配的制度还没有被发明出来。

两千年前,花了一个世纪的辩论才建立起盐铁治理制度。一个世纪前,花了数十年才建立起治理石油的 OPEC 和石油美元体系。Token 时代走得更快。治理制度需要在几年内建立,而非几十年,因为它所治理的资源以光速移动。

问题不是 token 治理是否会出现。而是它是否出现得够快。

FAQ

AI 语境下的 token 到底是什么? Token 是大语言模型中计算的基本单位。粗略地说,一个 token 约等于英文的 3/4 个单词。当你向 AI 模型发送 prompt 时,输入被拆分为 token,经过模型处理,输出逐个 token 生成。你按消耗的 token 付费,通常以每百万 token 计价。

为什么把 token 和盐铁、石油类比? 盐铁是农业经济的基础资源:食物保存和工具制造离不开它们。石油是工业经济的基础资源:交通、制造和战争离不开它。Token 是 AI 经济的基础资源:智能生产离不开它,而智能生产正在成为所有其他生产活动的瓶颈。在每一种情况下,对资源的控制直接转化为经济和地缘政治权力。

开源模型不是谁都能生产 token 吗? 技术上是的,这也是为什么 token 的垄断比盐铁或石油更软。Meta 的 LLaMA 系列等开源模型对任何拥有足够 GPU 硬件的人可用。但生产前沿级别的 token(支撑最先进的推理、编程和多模态任务的那种)需要大规模计算集群、专业人才和数十亿美元的训练投入。"能在本地跑模型"和"能大规模生产前沿智能"之间的差距,类似于"能打一口井"和"能运营一座炼油厂"之间的差距。

API 中转服务是怎么运作的? API 中转服务充当用户和 AI 提供商之间的中间人。用户以本币向中转服务付款,中转服务通过自己的基础设施路由 API 请求,并以提供商偏好的货币向其支付。从用户角度看,他访问了模型。从提供商角度看,它服务了一个国内客户。两国的官方记录中都没有出现跨境金融交易。

"Token 央行"会是什么样子? 具体形态是推测性的,但功能需求可以从历史先例推断。它需要:许可和监督 token 中间商(中转服务、API 聚合商);维持对跨境 token 流量的可见性;建立准备金要求(可能是算力准备金而非金融准备金);制定类似货币政策的"token 政策",调整 token 生产和分配的条件以实现战略目标。这个机构是政府机关、国际组织还是新型公私合营体,还有待观察。

参考资料


Comment