Administrator
Published on 2026-04-08 / 6 Visits
0
0

"Token 预算是能力上限,不是消费预算"

一、Jensen Huang 的标尺

GTC 2026 上,Jensen Huang 说过一句让很多人睡不着觉的话:年薪 50 万美元的工程师,至少应该把 25 万花在 token 上,否则他会 "deeply alarmed"。这不是比喻——Nvidia 全公司 2024 年的 token 预算据报道高达 20 亿美元。

这背后有一个合乎逻辑的推算:当 AI 能替代一个高级工程师 30% 的工作时,花 25 万购买 AI 能力是合理的投入。问题是,大多数人拿到这个预算之后,根本不知道该怎么花。

与此同时,模型价格在剧烈下跌。GPT-4 级别的 input token 从 2023 年的 $30/M 跌到 2026 年的 $2.5/M,三年跌幅 92%,数据来源 flowith.io。但另一边,GPU 租赁价格却在上涨——SemiAnalysis 的 H100 租赁指数持续走高,供给端收紧而需求端在暴涨。

这个矛盾说明什么?低价是窗口期,但窗口不会永远开着。当更多人涌入、AI 应用规模化之后,算力供给会重新紧张,价格会反弹。现在 token 价格便宜,不是因为 AI 变廉价了,而是因为竞争格局还没稳定。

二、群里的真实数字

光看宏观数据容易无感。来点真实的。

胥克谦月消耗约 400 亿 token。群友 Nick 日均 3 亿,杨正武日均 2 亿。有人在社区分享自己单月 Opus 账单:2700 美元。

这些数字听起来吓人,但老码农知道怎么换算。马工说过一句话很到位:1B 听起来很大,说白了就是 1000 个 1M 上下文的对话——一个人一个月,光对话就能烧到这个量级。

老冒有个更细微的观察:当你把 context 撑到 1M 之后,token 消耗"神奇地变少了"。这不是模型变贵了,而是你的使用深度在增加——你在问更复杂的问题、做更长的推理,消耗自然上升。但模型本身的能力进化(更强的推理效率)部分抵消了这个红利,一减一加,账上的数字就出现了那种奇怪的走势。

三、Token 投资与 Token 消费

这是全文的核心区分。

有 context infrastructure 的 token 消耗是"投资",没有的是"消费"。

两者的区别在于:投资产生的价值会沉淀下来,消费产生的价值随对话结束而消失。

同样 1 亿 token,两种用法:

有体系的人,每次对话建立在之前沉淀的知识上。上一轮对话产生的分析结论、代码模式、决策框架,都被持久化到某个地方(文档、记忆系统、工具链),下一次对话直接从沉淀开始。边际成本递减,token 越花越省。

没体系的人,每次对话从零开始。背景要重新描述,术语要重新对齐,上下文要重新建立——30% 到 50% 的 token 浪费在重复建立 context 上。1 亿 token 砸下去,对话结束后什么都不剩。

胥克谦说过一句完整的话,大意是:便宜的时候烧出来的都是能力,贵了舍不得烧的时候,就再也跟不上了。这句话成立的前提是:你得有体系让"烧"变成"炼"。没有体系的烧,只是烧钱。

这里有三条不容易察觉的逻辑:

当代码生成成本趋零时,真正值钱的不是代码本身,而是理解代码、验证代码、基于代码做决策的能力。代码是消耗品,认知才是资产。

竞争优势不来自模型的边际智能提升,而来自你与模型之间累积的熟悉度——模型知道你想要什么,你知道怎么问对的问题。这种默契需要时间沉淀,不是充值能买到的。

文档是把短期上下文窗口转化为长期资产的方式。上下文窗口是一次性的,文档是可版本化、可 diff、可复用的。把每一次好的对话炼成文档,才是真正的沉淀。

四、Token 预算是能力上限,不是消费预算

社区里有个叫"多喝热水"的群友,他的习惯是提交代码、打 tag 都让模型做。别人说他懒,他说他是在锚定一种新的效率基线。这个观察很准——不是懒,是一种工作方式正在成形。

Jensen Huang 预测,token 预算未来会成为薪酬包的一部分,像 CAD 许可证一样标配。你年薪 50 万,里面有 25 万是 AI 预算,你愿不愿意?大多数人的答案是愿意,但不知道怎么花。

AI 的收益难量化,不用 AI 的风险却确定且在增长。这是管理上的两难。

三个层次:

不用 token → 能力不变,风险最大,但账面上最省钱。

用了没体系 → 烧钱但不积累。比不用还贵,因为你在为每次从零建立 context 的重复劳动买单。

大量消耗 + context infrastructure → 复利增长。每多花一块钱,产生的边际价值在递增。你的 context infrastructure 越完善,同样的 token 消耗带来的能力提升越大。

所以 Token 预算是能力上限,不是消费预算。你敢不敢把这个上限往上提,取决于你有没有本事把每一分钱都变成能力而不是灰烬。

五、你的杠杆率是多少

问题不是"用不用"甚至不是"用多少",而是:每花一块钱 token,产生多少持久价值

这才是杠杆率。

提高杠杆率的方法很简单——建文档体系、沉淀方法论、积累被验证的模式。这些听起来是老生常谈,但它们就是在帮你把每一次 token 消耗从消费变成投资。context infrastructure 不是玄学,就是这些具体的东西。

Token 价格在跌,但 context infrastructure 的价值在涨。现在投资基础设施,是在给未来的自己买杠杆。等所有人都意识到的时候,窗口已经关上了。



Comment