SheepNav
新上线今天0 投票

AI 账单到期:行业争相管理失控的 Token 成本

从“Token 狂欢”到“成本危机”

2025 年上半年,AI 行业经历了一场剧烈的成本觉醒。曾经鼓励团队“不计成本、快速推进”的 CEO 们,如今面对的是暴涨的 Token 账单。

Uber 在 4 月就用完了原本规划到 2026 年的 AI 编码预算;微软在开放数月后,撤销了开发者的 Claude Code 授权;Priceline 员工透露,一次常规的 Cursor 合同续约费用涨了 4-5 倍。这些案例并非孤例——一家公司甚至因未设置使用限制,收到了 5 亿美元的 Claude 账单。

尽管单次 Token 价格持续下降,但更强大的模型(如 Anthropic 的 Claude Opus 4.5、OpenAI 的 GPT-5.1、Google 的 Gemini 3 Pro)以及智能体工具的普及,使得 Token 消耗量呈指数级增长。企业发现,2025 年初签署的“无限订阅”套餐,现在成了财务噩梦。

行业自救:从“能做什么”到“花在哪”

OpenAI 企业负责人 Alexander Embiricos 表示,六个月前客户还在问“模型能做什么?够用吗?”,而现在问题变成了:“我们花得太多了。你们有什么可见性?可审计性?Token 控制?模型效率如何?”

这一转变催生了新的市场机会。Linux 基金会本周宣布成立 Tokenomics Foundation,一个专注于 AI Token 成本管理的新标准组织,旨在像 FinOps 重塑云成本一样,为 AI 支出建立纪律。FinOps 基金会执行董事 J.R. Storment 指出:“4、5 月份开始,企业纷纷传来生存危机:我们 2026 年的 Token 预算在 4 月就超了 3 倍。对话从‘Token 最大化、快跑’变成了‘我们需要护栏,如何控制?’”。

市场与未来

初创公司、既有供应商和标准机构正在竞相提供工具,帮助企业追踪、审计和优化 AI 支出。这场成本危机不仅考验企业的预算管理能力,也重新定义了 AI 落地的经济模型。当“烧钱换增长”不再可持续,精细化运营与成本可见性将成为下一阶段的关键竞争力。

延伸阅读

  1. 谷歌每月向SpaceX支付9.2亿美元,租用11万块英伟达GPU
  2. S&P 500 拒绝 SpaceX,也堵上了 OpenAI 和 Anthropic 的入场大门
  3. Prime Day 最佳笔记本电脑优惠:8 款我自己都会买的超值之选
查看原文