Inside Anthropic's $100 Billion AI Compute Commitment | CFO Krishna Rao
概要
- Anthropic 在 2026 Q1 实现了年化收入从 $9B 到 $30B+ 的跃升,核心驱动力是"前沿智能的回报极高"这一商业命题——每次模型迭代不是简单提分,而是多维能力跃升(长任务、工具使用、agentic task 速度),直接解锁新的 TAM 和客户用量。净美元留存率超过 500%,Fortune 10 中 9 家已是客户。
- 算力是 Anthropic 的"画布",也是最难的决策。公司同时使用 Amazon Trainium、Google TPU、Nvidia GPU 三大芯片平台并实现跨平台灵活调配(fungibility),在训练、内部加速、客户推理三类用途间动态分配。Krishna 本人 30-40% 的时间花在算力相关事务上。上月签署了总额超 $100B 的算力承诺——Google/Broadcom 5GW TPU(2027 起)+ Amazon 5GW Trainium,加上与 SpaceX Colossus 设施的近期合作。
- 定价遵循 Jevons 悖论逻辑:Opus 4.5 发布时降价,结果消费量远超预期增长,客户在 Opus 4.6 发布时可无缝升级且价格不变。公司优先追求"算力全包络的 ROI"而非传统的按 token 变动成本核算,因为同一块芯片可能白天跑推理、晚上跑训练——这种 fungibility 让传统的 COGS/R&D 分类失效。
- Anthropic 的安全研究投入产生了意料之外的商业正外部性:interpretability(模型 MRI)让团队更擅长建模,alignment science 提升模型可控性,而这两者恰恰是 Fortune 500 客户将最敏感工作流托付给 Claude 的信任基础。Mythos 的分阶段发布是这一哲学的具体体现——模型在网络安全维度能力激增(开源代码库发现 250 个漏洞 vs 前代 22 个),因此采用受控发布路径。
- 内部文化是人才壁垒的核心:7 位联合创始人全部在职,早期 20-30 名员工绝大多数留任;Meta 大规模高薪挖人时 Anthropic 只流失 2 人,其他 lab 流失数十人。文化面试是硬门槛——技术满分但文化不过关的候选人不予录用。
- 贯穿全场的核心线索是"指数思维 vs 线性思维"——从 Krishna 初加入时不相信增长预测,到 Dario 一直是比他更准的收入预测者,到"cone of uncertainty"决策框架,到 Tom Brown 那次让他觉得"科幻"的 2.5 小时散步谈话最终大部分成真,每一个叙事都在说同一件事:这个行业对线性思维者持续不友好,而 Anthropic 的组织设计正在系统性地逼迫自己跳出线性框架。
核心洞察
- Anthropic 在 2026 Q1 实现了年化收入从 $9B 到 $30B+ 的跃升,核心驱动力是"前沿智能的回报极高"这一商业命题——每次模型迭代不是简单提分,而是多维能力跃升(长任务、工具使用、agentic task 速度),直接解锁新的 TAM 和客户用量。净美元留存率超过 500%,Fortune 10 中 9 家已是客户。
- 算力是 Anthropic 的"画布",也是最难的决策。公司同时使用 Amazon Trainium、Google TPU、Nvidia GPU 三大芯片平台并实现跨平台灵活调配(fungibility),在训练、内部加速、客户推理三类用途间动态分配。Krishna 本人 30-40% 的时间花在算力相关事务上。上月签署了总额超 $100B 的算力承诺——Google/Broadcom 5GW TPU(2027 起)+ Amazon 5GW Trainium,加上与 SpaceX Colossus 设施的近期合作。
- 定价遵循 Jevons 悖论逻辑:Opus 4.5 发布时降价,结果消费量远超预期增长,客户在 Opus 4.6 发布时可无缝升级且价格不变。公司优先追求"算力全包络的 ROI"而非传统的按 token 变动成本核算,因为同一块芯片可能白天跑推理、晚上跑训练——这种 fungibility 让传统的 COGS/R&D 分类失效。
- Anthropic 的安全研究投入产生了意料之外的商业正外部性:interpretability(模型 MRI)让团队更擅长建模,alignment science 提升模型可控性,而这两者恰恰是 Fortune 500 客户将最敏感工作流托付给 Claude 的信任基础。Mythos 的分阶段发布是这一哲学的具体体现——模型在网络安全维度能力激增(开源代码库发现 250 个漏洞 vs 前代 22 个),因此采用受控发布路径。
- 内部文化是人才壁垒的核心:7 位联合创始人全部在职,早期 20-30 名员工绝大多数留任;Meta 大规模高薪挖人时 Anthropic 只流失 2 人,其他 lab 流失数十人。文化面试是硬门槛——技术满分但文化不过关的候选人不予录用。
- 贯穿全场的核心线索是"指数思维 vs 线性思维"——从 Krishna 初加入时不相信增长预测,到 Dario 一直是比他更准的收入预测者,到"cone of uncertainty"决策框架,到 Tom Brown 那次让他觉得"科幻"的 2.5 小时散步谈话最终大部分成真,每一个叙事都在说同一件事:这个行业对线性思维者持续不友好,而 Anthropic 的组织设计正在系统性地逼迫自己跳出线性框架。
算力是"画布":采购、分配与 cone of uncertainty 决策框架
核心论点:算力采购是公司最重大的决策——买多了会死,买少了到不了前沿,而指数增长让预测极难。
- 算力有三类用途:模型训练/研发、内部员工加速、客户推理服务。三者之间不是固定比例分配,而是高度动态的协作式讨论——有一个硬性下限给模型研发,"即使这意味着更难服务客户,我们也不会低于这个研发投入"
- "Cone of uncertainty" 是核心决策框架:指数增长下,周/月增长率的微小波动经复利会产生截然不同的结果。公司看 1-2 年的多种情景,然后倒推算力需求。传统的"每季度做一次预测、下次董事会再讨论"在这个业务中完全失效
- Krishna 个人花 30-40% 时间在算力上,公司不仅有算力采购会议,还有算力分配会议。分配讨论的核心是各团队阐述"给我这些算力,我能产生什么 ROI"
- 灵活性(flexibility)被刻意设计进采购合同本身:签约时就为不确定性预留弹性。同时,高效利用现有算力是在"不确定性锥"中从当前位置到目标位置的桥梁
"If you buy too much compute, you go out of business. If you buy too little compute, you can't serve your customers and you're not at the frontier—which is the same thing." —— Krishna Rao
三大芯片平台的 fungibility:Anthropic 自认为算力效率最高的前沿 lab
核心论点:同时运营 Trainium/TPU/GPU 三个平台并实现跨平台灵活调配,是 Anthropic 多年投入建成的竞争壁垒。
- 三大平台:Amazon Trainium、Google TPU、Nvidia GPU。每个平台内部还有多代芯片(TPU V5e/V6/V7、Trainium 2/3 等),各代在价格-性能曲线上位置不同
- 团队与 Amazon Annaperna Labs 深度嵌入合作,直接影响芯片路线图。"我们正在把这些芯片推到极限"——组织内 1 美元算力的效用比其他任何地方都高
- 从芯片层面往上自建编译器和编排层,以实现精细化的工作负载调度:同一块芯片可能早上跑推理、下午/晚上跑模型训练
- 早期使用 TPU(大约第三代)时被外界认为"疯了,所有人都在用 GPU"。如今这个多年投资成为了关键优势
- 如果明天凭空获得 2x 或 10x 的算力,"今天我们可以非常快地部署几乎任何类型的算力"——一两年前还做不到这一点,因为不同芯片平台有各自的特殊性
"A dollar of compute inside our organization goes further than I think it does anywhere else." —— Krishna Rao
Frontier intelligence 的回报:从 $9B 到 $30B 的 Q1 跃升
核心论点:前沿智能的回报极高,尤其在企业市场——每次模型跃升都解锁新 TAM,而非简单替代旧模型。
- Anthropic 不把模型智能看作单一 IQ 分数,而是多维能力:长时间任务、工具使用、计算机使用、agentic 任务速度。"两个同样能力的员工,一个一周完成、一个一天完成——后者等效于 7 倍产出"
- 从 Opus 4 到 4.5、4.6、4.7,每一代不仅智能提升,效率也同步提升——打破了"从轿车升级到跑车就要牺牲油耗"的类比。RL 训练本身也受益于更高效的推理(RL 本质上是沙箱内的推理 + 奖励函数)
- 传统基准测试已经饱和,真正的衡量标准是客户反馈的真实世界能力。客户发现痛点 → 反馈给 Anthropic → 成为训练目标(不使用客户数据,企业端;prosumer 端仅在用户 opt-in 时)
- 2026 年 1 月 30 个产品/功能发布,研发节奏加速,部分由模型自身加速——"90%+ 的代码由 Claude Code 编写,很多 Claude Code 本身也是 Claude Code 写的"
- Patrick 提到 Opus 4.7 或 GPT 5.5 一出,消费者第一反应就是切到最新模型。Krishna 确认企业端更甚——客户在新模型上投入更多 token,这个循环反复重演
"We started the year with about $9 billion of run rate revenue and we ended the quarter with north of $30 billion of run rate revenue." —— Krishna Rao
Scaling laws 未放缓,递归自改进正在发生
核心论点:Anthropic 内部观测到 scaling laws 仍然强劲,且模型正在加速自身研发——但公司保持"科学方法式的怀疑"。
- Scaling laws 论文的部分作者就是 Anthropic 联合创始人,但团队依然保持怀疑态度——"不断挑战既有假设"是研究文化的核心
- 内部通过不同训练阶段(预训练 loss curve、RL、客户实际反馈)多维度评估模型能力,不只看公开 benchmark
- 对于"开源 vs 闭源",Anthropic 的框架是"前沿 vs 非前沿"——前沿模型在捕获经济价值、驱动客户 ROI 方面有明确优势,递归自改进可能让先到者的领先不断扩大
- Patrick 追问"scaling laws 有没有放缓",Krishna 直接回答:"For us, that's a fair characterization—没有放缓。"但也补充"我们不能 100% 确定说它永远不会"
算力生态与 $100B+ 承诺
核心论点:Anthropic 是唯一同时在三朵云上运营、使用三大芯片平台的前沿 lab,合作关系远比"采购"深得多。
- 上月签署的重磅交易:Google + Broadcom 5GW TPU(2027 年起)、Amazon 5GW Trainium——总承诺超 $100B。大量算力今年和明年就开始到位
- 与 SpaceX 的 Colossus 设施(Memphis)达成合作,主要服务消费者和 prosumer 端的扩展。消息在录制前 15 分钟才公布
- 合作伙伴关系是多层次的:芯片开发(与 Annaperna Labs 共同影响路线图)→ 容量规划 → 服务部署 → 分发渠道(三朵云也是分发引擎)
- 算力采购像"层蛋糕"(layer cake):不同时间到位、不同能力的芯片,需要动态比较其性价比
定价哲学:Jevons 悖论与算力 ROI
核心论点:Anthropic 追求的不是传统的按 token 毛利,而是整个算力包络(compute envelope)的全盘 ROI。
- 公司成立 5 年+,第一笔收入是 2023 年 3 月,第一个真正的 frontier model 是 2024 年 3 月。定价体系(Haiku/Sonnet/Opus/Mythos)相对稳定,很少调整
- 最大的一次定价变动是 Opus 4.5 发布时降价——发现 Opus 级模型被严重低估使用(客户试图用 Sonnet 处理 Opus 级任务)。降价后出现 Jevons 悖论:消费量增长远超预期
- 投资者最难理解的范式转换:算力不是简单的变动成本。同一台机器白天服务客户推理、晚上做模型训练——传统的 COGS vs R&D 分类在这里失效。"如果把所有分配给内部员工的算力转为服务客户,可以产生数十亿美元收入"——但长期来看内部使用的 ROI 更高
- Q1 收入从 $9B 跃升到 $30B,"并不是这段时间突然上线了一堆新算力"——算力到位可能是 12 个月前决定的,收入增长来自效率提升和模型能力解锁
"We lowered the price of Opus, but the consumption went up way, way more than what you would have expected." —— Krishna Rao
平台战略:大部分水平化,有选择地垂直化
核心论点:Anthropic 的核心定位是平台(类比早期 AWS),在特定领域建应用是为了引领市场方向而非通吃。
- 平台层包括:原始模型 API、prompt caching、虚拟机、Claude Code、Dispatch、Claude Agents SDK、Managed Agents——所有这些都是让其他公司将模型智能嵌入自有产品的向量
- 自建应用的两个标准:(1) 对模型未来能力有独特洞察,可以领先市场验证(如 Claude Code——发布时模型能力还不足以完全支撑,但团队知道会到达);(2) 为生态系统树立标杆(如 Claude for Financial Services、Claude for Life Sciences、Claude Security),通常以合作方式推出
- Patrick 提出"客户怕你"的问题——模型能力的跃进有时连 Anthropic 自己都感到惊讶,客户自然更会被震撼。应对方式是提前接入(early access programs)+ 合作伙伴导向
Anthropic 内部 Claude 使用:finance 团队的实战
核心论点:Anthropic finance 团队是公司最激进的 Claude 用户之一,从"用 Claude Code 做非编程任务"的探索中催生了 Co-work 产品的早期雏形。
- 约一年前开始用 Claude Code 做非编程任务("是不是所有人都在 vibe coding?"),这一实践后来直接启发了 Co-work 产品的诞生
- 当前能力:所有法律实体的法定财务报表由 Claude 生成(人工审核);内部实时平台 Ant Stats 用于日常数据分析
- Finance 团队建立了 70+ 个 Claude skills 的共享库,所有人可调用。最核心的是 MFR(Monthly Financial Review)skill——90-95% 由 Claude 完成,讨论焦点从"发生了什么"转向"有什么战略含义"
- 周报从数小时缩短到 30 分钟。"Cloud 不只是报天气,还在帮我们理解为什么数字变化了"
- 内部有 token 使用排行榜(不与薪酬挂钩)。最高用户之一是税务负责人(head of tax),正在构建税收政策引擎和自动化工作流——"不是只有 22 岁的程序员在用,资深员工的使用量反而更大"
"If we're not super users of this, if we're not pushing the limits of it, how can you expect customers to do that?" —— Krishna Rao
投资者关系:$75B 融资历程与投资者认知的演变
核心论点:每一轮融资都伴随着投资者对 Anthropic 的不同误解,但业务持续用指数增长打破线性预判。
- Series D(Krishna 刚加入时,~$250M run rate):投资者质疑"为什么需要 frontier model"、"AI safety 和商业目标矛盾"、"销售团队太小"。当时公司刚拥有真正的 frontier model 不久,FTX 清算股份增加了不确定性
- Series E(2024 年底,~$1B run rate):首次 close 当天恰逢 DeepSeek 新闻爆出——"投资者开始问,我是不是应该完全重新评估 AI 投资?"。投资者接受了增长事实但不相信能持续——"没有办法保持这个增速,物理定律不允许,企业采用需要很多年"
- 至今已融资 $75B,另有 $50B 来自 Amazon/Google 交易将在未来到位。"融资更多是因为 cone of uncertainty 而非实际亏损"
- Krishna 坦承自己最初也是线性思维者:"我加入时问'$1B run rate 是哪一年?'——Dario 一直是比我更好的收入预测者"
Mythos 发布与安全框架
核心论点:Mythos 不只是一个"网络安全模型",而是全方位顶级模型中恰好在 cyber 维度出现能力尖峰——这触发了 Anthropic 首次采用分阶段发布。
- Patrick 说身边很多关注 AI 的朋友第一次表示"这个让我害怕了"
- 关键对比:在同一个开源代码库中,前代模型发现 22 个安全漏洞,Mythos 发现 250 个——能力跃升超过 10 倍
- 分阶段发布(phased release)的逻辑:不是不发布,而是先给可控群体使用,聚焦 cyber 能力如何被防御性地(而非攻击性地)使用,然后逐步扩大
- 这一做法可能成为未来模型发布的模板,是 Anthropic 安全理念的具体实践
文化作为竞争壁垒:七位联创全部在职
核心论点:Anthropic 的文化不是 PR 包装,而是通过实际的筛选机制和行为准则构建的——文化面试是硬门槛,人才留存数据是最好的证明。
- 7 位联合创始人全部在职,早期 20-30 名员工绝大多数仍在。Meta 大规模高薪挖人时,Anthropic 只流失 2 人,其他 lab 流失数十人
- 文化面试不是走过场——技术满分但文化不过的候选人不录用。核心特质:极度协作(不容忍山头主义和邀功)、谦逊("竞争对手极其强大,成功远非必然")、达到里程碑时不是庆祝而是"下一步是什么"
- Dario 每两周做全员会,会前写短文档讲 3-4 个话题,然后接受全公司开放提问——"不是软球,不是安排好的问题"
- "Talent density beats talent mass":不追求规模最大的团队,而是追求密度最高的 AI 研究和推理工程人才
- Krishna 的招聘哲学:"我不是在招下属,是在招合伙人"——从 hyperscaler、大型软件公司、金融服务业吸引的人才各有不同视角,这种多元视角在指数增长的业务中尤为关键
Virtual collaborator 愿景与 Co-work 的崛起
核心论点:Anthropic 的产品终局是"虚拟协作者"——具备组织 context、工具使用、记忆、长时间工作能力的 AI 同事。
- 从 Claude Code 到 Co-work 的演进路径:Claude Code 改变了 agentic 软件开发,Co-work 要把同样的范式扩展到所有知识工作
- Co-work 以相同时间节点为基准的增长速度比 Claude Code 更快——"开发者是技术最快的采用者,但 Co-work 超过了 Claude Code 的早期增速"
- 产品开发本身也在变化:不再是"一个 PM + 两个工程师做 3 个月",而是每天发布、一支 agent 舰队协同工作。"每个人都变成了 manager"
- 虚拟协作者需要的能力维度:组织级 context、专有工具调用、从自身和用户的错误中学习的记忆、在长时间尺度上处理不只是"任务"而是"想法"的能力
Tom Brown 的"科幻散步"与 Krishna 的个人成长
核心论点:在指数级变化的业务中,最重要的个人能力是"第一性原理思维"和"极低的信念更新门槛"。
- 加入前,Tom Brown(首席算力官、联合创始人之一)带 Krishna 在旧金山 Mission 区散步 2.5 小时,描述了公司未来愿景。"老实说,听起来像科幻小说。"Krishna 回家告诉妻子:"即使只有 10% 成真,这也将颠覆所有范式。"——大部分已经成真,但仍有更远的未实现部分
- 以前在 Blackstone 做私募股权的训练——"在颗粒度层面思考事物"——依然有价值,但"在这个业务中你不可能对每件事都保持 500 英尺的高度,surface area 太大了"
- 此前帮助 Airbnb 在疫情中完成融资(7 周内收入下降 70%),那是另一个"没有先例、没有模板可匹配"的极端场景
- 公司要求的思维模式转换:不做点估计而是做情景分析,对更新自己的先验保持极低门槛——"一个月前成立的假设可能今天就不成立了"
未来最乐观的领域:生物科技与药物研发
核心论点:Krishna 个人最兴奋的 AI 应用方向是生物科技——当实验室通量提升 10x-100x 时,曾经不可治愈的疾病有望在患者有生之年找到治疗方法。
- 当前 AI 已在加速药物开发的行政流程(临床研究报告等文书工作),但更让 Krishna 兴奋的是 AI 深入药物发现阶段——分子和蛋白质的极小变化有极大的结果差异,AI 完美适合这类搜索空间
- Dario 的 "Machines of Loving Grace" 长文所描绘的愿景:医疗健康交付方式变革、发展中国家生活水平提升、不仅限于主流疾病还包括罕见病
- 同时强调"不应该只讲好消息"——压缩到数月内发生的变化会带来颠簸,需要商业和政府共同制定应对方案。"如果有人只告诉我好消息不告诉我坏消息,我就不信任这个视角了"
兄长的牺牲
Patrick 传统闭场问题"有人对你做过的最善良的事是什么"——Krishna 讲了一个他多年后才知道的家庭故事:哥哥比他大 5.5 岁,高中时被所有申请的大学录取,但选择了州内公立大学。多年后 Krishna 才得知,哥哥做这个决定的重要原因之一,是为了把家庭教育资金留给 6 年后才上大学的弟弟——"12 岁的我完全不会理解这件事"。Patrick 说做了约 600 期节目,从未听过这种类型的回答。
附录:关键人/机构/产品/数据
| 名称 | 说明 |
|---|---|
| Krishna Rao | Anthropic CFO,加入约 2 年,此前在 Blackstone PE + Cedar |
| Dario Amodei | Anthropic CEO,被 Krishna 形容为"比我更好的收入预测者" |
| Tom Brown | Anthropic 首席算力官、联合创始人之一、scaling laws 论文作者之一 |
| Annaperna Labs | Amazon 芯片团队,与 Anthropic 深度嵌入合作 |
| Ant Stats | Anthropic 内部实时财务分析平台 |
| MFR skill | Monthly Financial Review 自动化技能,90-95% 由 Claude 完成 |
| Co-work | Claude Code 之后的知识工作协作产品,增速超 Claude Code 早期 |
| Mythos | 最新模型,cyber 能力尖峰(250 vs 22 漏洞),首次分阶段发布 |
| Colossus | SpaceX 在 Memphis 的算力设施,Anthropic 近期合作对象 |
| $9B → $30B+ | 2026 Q1 年化收入跃升 |
| 500%+ | 年化净美元留存率 |
| $75B | Krishna 加入以来的融资总额 |
| $100B+ | 算力承诺总额(Google 5GW + Amazon 5GW + 其他) |
| 9/10 | Fortune 10 中的客户数 |
| 70+ | Finance 团队 Claude skills 数量 |