Inside the Mind of Anthropic CEO Dario Amodei

节目

Moconomy

嘉宾

Dario Amodei

日期

2026-06

时长

70 min

查看原始内容 →

概要

"平滑的指数曲线"是 Dario 理解整个世界的元框架。他把当下的体感比作"以相对论速度飞离地球"：你睡一觉醒来地球上过了两天，再睡一觉过了三天、四天——加速度本身在加速。Anthropic 成为营收和估值最高的 AI 公司，对他"既不意外（图上只是一条平滑的线），又充满意外（真正发生时细节和色彩远超想象）"。这条曲线也是他评判他人是否"严肃"的标尺：在"毫不担心"和"今天就要恐慌"之间来回横跳（yo-yoing）是不成熟决策的标志。

离开 OpenAI 的真正原因是信任崩塌，而非安全分歧。Dario 罕见地直说：安全上的分歧人人都有，"光是分歧不足以让人离开"；真正让他走的是"当你感到无法信任某人、感到他们的价值观不是他们说的那样、感到他们不诚实、看到令人不安的行为模式"。他对"我们各干各的、市场和公众舆论会决出胜负"完全平静。

押注企业级与 coding 而非消费级 splashy apps，是价值观与商业模式的刻意对齐。Claude Code、Claude co-work 都成了 hit；Claude co-work 发布后一夜 $2850 亿市值蒸发，被交易员称为"SaaS 末日"。他判断软件业整体会变大不变小（蛋糕做大 10x，既有玩家涨 1.5x 也算落后），但拒绝绝症式预测。

失业警告被 3 秒切片扭曲，他强烈反击"末日营销"指控。他坚持自己一年前"1-5 年内消灭一半入门级白领岗位"的论断本就是"展示事情能有多疯狂的数量级"，且每次都同时谈解决方案（token 税、转岗、宏观政策）。对 Jensen Huang"混淆 tasks 与 jobs"和"廉价营销"的批评，他回击"说这是廉价营销本身才是廉价营销，是懒惰，是不愿严肃思考"。

在国防、伊朗女校空袭、Mythos 网络武器三件事上，Dario 把"红线哲学"推到了最尖锐处。他是首批与国防部签约上机密网络的 AI 公司 CEO，却因划下"反大规模监控、反全自主武器"红线被总统禁入联邦政府、被五角大楼贴"供应链风险"标签、被 OpenAI 抢走合同。面对伊朗女校 150+ 人（多为儿童）死亡的追问，他反复回到一条原则："人类做最终决定"。

贯穿全场的主线是"平滑的指数 + 制衡"这对组合拳：因为相信曲线平滑可预测，所以反对恐慌式监管也反对放任；因为相信权力会失控，所以既要长期受益信托能炒掉自己、也要立法和司法对政府与公司双向制衡。他自比《原子弹的制造》里提出链式反应的 Leo Szilard，而把 Oppenheimer 视为"不该发生"的失败案例——拒绝做站在一切中心的"比生命更大"的人物。他自估文明崩溃概率 10-25%，并坚称 Anthropic 的行动是在降低而非抬高这个数字。

"平滑的指数曲线"：从相对论飞船到睡眠管理

核心要点：Dario 用一个统一的隐喻——平滑的指数曲线——同时解释他的失眠、他的世界观、和他对"成熟决策"的定义。

开场 Emily 问"你睡多少？"，Dario 承认自己从来睡得不好，"正在学习在异常压力下放松和入睡的艺术"。
他对"内部感觉如何"的回答是整场访谈的题眼：想象你以相对论速度飞离地球，"你睡一觉醒来地球上过了两天，于是你得在一天里处理两天的事；再睡一觉，因为持续加速，过了三天；下一天是四天——感觉就有点像这样。"
但他拒绝"半夜醒来惊恐于会面对什么"的状态："偏执或担心醒来会面对什么，是没有生产力的。"他援引历史上处理高压情境的人：要像外科医生面对手术、军官面对军事行动那样理性回应，"维持一种基本的平静"。
他把"在'我不担心'和'天哪我们今天必须恐慌'之间来回横跳"明确定义为"不成熟决策的标志"；成熟的决策是"你不能忽视它、不能自满，事实上风险正越来越大，但你必须理性回应"。
Anthropic 成为营收与估值第一的 AI 公司，对他是同一条曲线的兑现："我看着这张图想，我们大概会在这个时间点左右成为营收和估值最高的 AI 公司——果然发生了。一方面我不意外，因为图上只是一条平滑的线；另一方面，真正发生时你看到太多细节和色彩，它确实令人惊讶。"

"Nothing's happening. Nothing's happening. 一点小事发生，然后 Zoom——它就疯了。这就是这个世界的体验。" —— Dario Amodei

旧金山童年：不墨守成规（nonconformism）如何塑造一个 AI CEO

核心要点：Dario 把自己"有连贯世界观就该去追，哪怕所有专家都反对"的胆量，追溯到旧金山的个人主义土壤。

父亲是皮匠（leather craftsman），母亲在图书馆工作。互联网革命就在身边发生，"我却完全没兴趣"——他只对数学、理解宇宙、科幻感兴趣，"对世界充满好奇"。
他认为旧金山"不墨守成规、个人主义、可以很疯狂也没关系"的精神确实影响了他。他对硅谷有很多尖锐批评，但欣赏其中一点："哪怕所有专家都反对你也没关系；只要你有一个连贯的愿景和世界观，你就该去追求它。也许根本行不通，但如果成了，这里有一种长尾性——某些矿脉里你可能挖到一座巨大的金矿。"
一段被采访者用来切入的私人史：2016 年，Dario、妹妹 Daniela 及其丈夫 Holden Karnofsky 同住一栋 group house。当时 Open Philanthropy 刚起步（Holden 主理），Dario 还是生物科学家，帮他们做发展中世界健康和生物研究方向的评估——"哪些领域有前景，哪些没那么有前景"。

"It's okay to be crazy——我想这其中很大一部分确实沾染到了我身上。" —— Dario Amodei

离开 OpenAI：不是安全分歧，是信任崩塌

核心要点：Dario 第一次如此直白地区分"安全分歧"与"信任崩塌"——前者人人都有，后者才是他离开的真正原因。

当 Emily 问"超越叙事，到底发生了什么、你们在什么问题上不合"，Dario 先发出一声轻蔑的"snort"，然后说"我要非常简单地说"。
他承认建造强大技术时有许多艰难议题，Anthropic 每天都面对、不知道决策是对是错；"安全上有很多正当的分歧，我们确实和他们有过一些。但光是这个不足以让人离开。这里的人也和我有分歧、彼此有分歧。"
转折点是信任："当你感到无法信任某人、感到他们的价值观不是他们所说的那样、感到他们不诚实、感到他们不是为了他们声称的理由而做、当你看到令人不安的行为模式、不诚实——这让你很难继续与一家公司合作、继续信任它。"
他的态度是彻底的平静与切割："当你没有相同愿景、又不信任对方时，为什么要争论？解决方式就是你去做你的事，他们去做他们的事。我完全心平气和。我们会看谁在市场上赢，谁在公众舆论的法庭上赢——这些比任何关于谁离开了什么的戏剧都更响亮。"

"People here have had disagreements with me... But when you feel that you can't trust someone, that makes it very hard to continue to work with a company." —— Dario Amodei

印度峰会"拒绝牵手"与 race to the top（向上竞赛）

核心要点：面对"连建造最重要技术的人都不能在台上牵手，怎么相信你们会在生存风险上合作"的尖锐追问，Dario 用"可信玩家联手挤压不可信玩家"的机制作答。

名场面还原：印度 AI 峰会上，Dario 与 Sam Altman 似乎拒绝在台上牵手。Dario 的解释是峰会"极度混乱"——"我们都最后一刻才上台，他们又改了我们站的顺序，给我们拍照，然后命令我们都牵手。"他补充"突然 Narendra Modi 在台上让所有人牵手"，全场被逗笑。Emily 不依不饶："可别人都牵了，得了吧。"
但他随即把话题拉回严肃："建造这项技术的人，在质量和可信度上存在巨大差异。那种'没人信任彼此'的 meme，我不认为是对的。"他举证：认识做 Gemini 的 Demis Hassabis 已 15 年，"我们一起处理过若干议题，我们从 Google 买算力，我们一直在交换安全理念。"
他的核心机制是 race to the top 的"胡萝卜+大棒"：
胡萝卜（正向激励）："Demis 做 AlphaFold，我们也想在生物上做点什么；我们做可解释性研究，他们也开始做可解释性研究。这甚至不是竞争——一家公司做了很酷的事，另一家说'那很酷，我们也想做'。"
大棒（隐性压力）：可信的多数若都做对的事，不可信者就被置于"不得不采纳同样标准"的境地；他们常常"一边勉强做对的事，一边假装在做不同的事、并暗示我们有什么阴险之处"——"这是可以预期的，但这正是我们让整个行业团结、合作的方式。"

"可信的行动者需要联合起来，把不可信的行动者逼到一个不得不采纳同样标准的位置。" —— Dario Amodei

押注企业级而非消费级：商业模式必须与价值观对齐

核心要点：Dario 把"做 coding 和企业级、不做 splashy 消费 app"讲成一个价值观选择——因为消费模式天然激励上瘾，而企业模式天然激励信任与长期关系。

他的底层逻辑："如果你选一个与价值观根本冲突的商业模式，你会很难——要么背叛自己的价值观，要么变得无关紧要，陷入 catch-22。远比这好的是选一个与价值观兼容的模式。"
为什么不做消费：他点名社交媒体和消费世界"鼓励参与度、甚至上瘾"；"我们看到的 AI 视频模型的 slop（垃圾内容），目的就是最大化你付出注意力的分钟数，因为那是广告驱动的激励。"
为什么企业级与价值观协同：他把"用 AI 治愈以前治不了的病、让能源更便宜、帮助教育、解决发展中世界健康、提升经济增长"这些他眼中 AI 最大的正面价值，几乎全部归到企业（含非营利）名下。
另一层是信任结构："企业非常看重信任和长期关系——你和一家公司合作很多年，你兑现承诺，他们兑现承诺，他们基本上信任你。这与我们以正面、安全的方式部署模型的目标高度协同。"
他承认仍想更纯粹做企业级，但消费端"在我们没投入那么多精力的情况下也开始快速增长"。一个家庭场景的幽默插曲：他儿子昨天问"能用你的 Claude co-work 账号吗？"Dario 说"绝对不行，我需要我的 token。"

"选一个与你价值观根本冲突的商业模式，你要么背叛价值观，要么变得无关紧要。" —— Dario Amodei

模型质量是唯一护城河，"SaaS 末日"与软件业变大不变小

核心要点：Dario 拒绝依赖"黏性"，只押注模型质量；他预测 SaaS 会有大输家，但软件业整体的蛋糕会变大。

面对"开发者一下午就能从 Claude 切到 GPT 或 Gemini，真能有长期领先吗"，他回答："模型质量是最重要的事，我们现在在模型质量上遥遥领先。有一定的惯性，但我从不依赖它——Anthropic 从不依赖'这东西有黏性、人们不会切换'。你要有更好的模型、更好的产品。"他补充截至录制时增长率"完全没有拐头，如果有的话还在上升"。
"SaaS 末日"事件：Claude co-work 发布后不久，$2850 亿（285 billion）市值一夜蒸发，交易员称之为"SaaS apocalypse"。
他对软件业命运的判断是反直觉的"蛋糕变大"论：
会消失的护城河："快速写复杂软件"的能力——"如果你的护城河是'我们写了别人写不出的复杂软件'，那祝你好运，你守不住。"
会留下甚至更重要的护城河：客户关系、行业 know-how、独特领域知识。
他给所有 SaaS 公司的建议："列出你所有的护城河，清楚知道有些会消失、另一些会因为成为限制因素而相对更重要，可能还有新的护城河出现。"
"蛋糕变大"的数学："如果 AI 能让可能性增长 10x，一个既有行业很容易涨 1.5x——只是没有整块大蛋糕涨得快。"所以软件业会变大不变小，"尽管会有一些大输家——那些把头埋进沙子、不适应的人会非常难过。"

"做大的不是某一家，是整块蛋糕。既有巨头在相对意义上可能变小，有些甚至会倒闭，如果他们不以正确的方式适应。" —— Dario Amodei

万亿估值与算力爬坡：为什么需要这么多钱

核心要点：Dario 用"算力爬坡的不确定性锥"为近万亿估值辩护，并披露 2026 Q1 出现了远超计划的 80x 年化增速。

金主与张力：最大支持者是 Amazon、Google、Microsoft、Nvidia——既是合作伙伴又是对手，各有议程，且有与融资挂钩的巨额商业里程碑。Emily 问"到底谁说了算？"
Dario 的反例论证是对华芯片出口管制："我一直直言需要对华芯片出口管制，因为中国在 AI 能力上领先对美国、对世界民主状态都会非常糟糕。一些芯片制造商显然不同意，但这没阻止我说出来——即便我们签了更多合作，我现在还在说。他们知道我们总是与他们合作、是好伙伴；他们大概希望我们别说这些，但这些就是我相信的。我们都是成年人，可以在一件事上合作、在另一件事上分歧。"
估值辩护：Bloomberg 报道其估值高于 OpenAI、近 1 万亿美元（一家 5 岁创业公司）。他的逻辑是算力爬坡极快带来的"不确定性锥"——"一年后你会有三四倍的算力……融资是对这个不确定性锥的缓冲。这是完全理性的事，对业务的稀释非常小，而且逻辑上与基本面有问题完全是两回事，事实上恰恰相反。"
关键数据披露：Anthropic 原本规划算力 10x/年增长（"10x a year 是我们的预期"）；但 2026 第一季度看到的是"季度营收 >3x（未年化），而 3 的四次方是一年 80x"。"我们没规划 80x 的年化增长，规划那个也不理性——因为如果你只拿到 10x，你就多买了 8 倍。所以我们正处在一个局部极端的算力爆炸里，这不会持续；如果持续，到年底的营收数字是地球上没有公司能达到的。"
对"服务器吃紧、用户抱怨 token 用完、你说别家在算力上 yolo"的回应："算力是有市场的……在比几个月更长的时间里，我们能拿到大量算力。按任何合理标准我们都没买太少。"

"这些算力爬坡非常快，融资是对这个不确定性锥的缓冲——它是完全理性的，而且与基本面有问题恰恰相反。" —— Dario Amodei

规模化后如何坚守价值观：一半时间在讲文化

核心要点：Dario 认为"好模型"恰恰是 Anthropic 得以在扩张中坚持价值观的杠杆；而最大的威胁不是创始人变心，而是公司成分变化太快。

对"当你是 underdog 时占据道德高地容易，到这个规模有多难坚守"，他的回答是把商业成功与价值观看成协同而非对立："我实际上把'我们能做出这么好的模型'看作让我们能在公司变大时依然主张价值观的东西。"
真正的风险来自人员成分："不是因为我、联合创始人或公司领导的价值观变了，而是公司的成分变化非常快。当你增长这么快、从大科技公司招一堆人，如果你不告诉他们 Anthropic 怎么运作，他们只会复刻他们唯一知道的东西——他们原来公司的运作方式。"
因此他"大概把一半时间花在跟公司讲 Anthropic 的文化、文化如何运作"。他说这是"我和 Daniela 也许排第一的首要任务，因为我们认识到这是长期意义上我们是谁的核心"。

"我在每个规模上都偏执。公司每到一个规模都有新挑战、新的方式让它失去取胜的意志或价值观的内核。" —— Dario Amodei

产品速度的两个引擎：统一文化 + 用 Claude 造 Claude

核心要点：Dario 把"出货快得离谱"归因于两件事——组织/文化的高度统一，以及 Claude 自身正在加速模型与产品开发。

第一引擎："我们有一家统一的公司、统一的文化。我们变大了却依然极其高效、所有人还在同一页上——文化和组织的统一，我认为这是最大的因素。"
第二引擎："Claude 本身——我们现在用 Claude 帮助开发模型、让它们更高效、快速开发产品。有各种新做法要建立，我们还很新，但它正在产生大量加速，而且越来越是可靠的加速。"

见过最疯狂的 AI：Claude 诊断出名医漏诊的病，与"一个世纪的进步"

核心要点：这是全场最有体感的"乐观"段落——Dario 以前生物学家的身份，对 AI 在生物医学上的跃进发出由衷的"wow"。

故事核："我见过最疯狂的一些事是在生物和医学领域。包括 Daniela 本人在内，我见过若干案例，Claude 诊断出了一堆名医（fancy doctors）漏掉的医学问题。"
专业视角的震撼："在生物这边，模型在药物设计、计算化学这类任务上开始好得惊人。作为一个曾经的生物学家，我看着想——wow，这很难，你需要大量训练才能做，而 Claude 正在变得擅长。"
由此引出他的宏愿，被 Emily 接话："a century of scientific progress（一个世纪的科学进步）。" Dario 补全："一个世纪的科学进步，加上一个世纪的'作为人是什么体验'的进步。回到 1900 年，想想那时所有的问题、人们过早死亡的原因、所有的苦难和物质匮乏；再想象一百年这样的进步。我真心相信这个世纪的科学和医疗进步——如果我们能闯过去，我越来越乐观我们会——我们将拥有一个好得多得多的世界。"

"Claude diagnosed a medical problem that a bunch of fancy doctors had missed." —— Dario Amodei

写作与 Claude：用作头脑风暴而非代笔，守住思考的红利

核心要点：以 essay 著称的 Dario 拒绝让 Claude 直接代写，因为写作本身是他厘清思考、与他人建立共同参照点的方式。

他承认用 Claude，但"还没到允许 Claude 直接写的文字进入（成稿）的地步，因为我有非常特定的风格、有点挑剔"。Claude 的角色是支持性的："帮我头脑风暴、帮我想透主题、帮我想'有哪些参考可以用'。"
他坦言不知道距离"Claude 写得比我好"还有多远："我们还没到那一步，但我认为它肯定会来。"
关于"代笔会不会让我们失去批判性思考"，他的回答触及更深的点："这正是我自己写作的一半原因。我写作不只是为了外部读者（很多人读我写的东西），同样是为了厘清我自己的思考、知道下一步做什么，并在我和他人之间创造一个共同的参照点。如果我们端到端地用它——'写一篇关于 AI 风险的 essay'——首先它不会写出我所想的东西，其次我会恰好失去那个红利。"
他认为随着模型变好，"大概有办法更直接地用它来写作、同时仍保留那些红利，但这会是个微妙的事，得随时间摸索"。

"我写作同样是为了厘清自己的思考——如果让它端到端代写，我会恰好失去那个红利。" —— Dario Amodei

失业论：半数入门白领岗位、tasks vs jobs、与"末日营销"的正面交锋

核心要点：Dario 坚持自己的失业警告从来都"同时附带解决方案"，并对"doom marketing"的指控发起全场最激烈的反击。

他重申那句被反复掐头去尾的话："AI 可能在 1-5 年内消灭一半入门级白领岗位"——"那是一年前说的。"对"现在是否还是 50% 还是更高"，他强调原话始终是"我不知道会发生什么，但这是一个关于事情能有多疯狂的数量级"，且"从一开始我就在谈应对：token 税、与企业合作转岗，我对再培训项目有点怀疑但也该放进组合里，还有宏观经济政策"。
他的机制模型来自著作《技术的青春期》（adolescence of technology）："你自动化一份工作的 90%，很好，人们在剩下 10% 上效率提升 10 倍，因为他们的杠杆放大了 10 倍；但最终它逼近 100%，那时你就得为他们找别的事做。长期我真的不确定。"
Anthropic 内部的活样本：软件工程师正在经历这个转变——"现在 AI 让软件工程师更高效，即便 AI 写了几乎全部代码；但我们已经开始看到苗头，可能有些人 AI 已经不再让他们更高效，而是让 AI 直接做这件事更好。"另一面是新需求岗位：forward deployed engineer（前向部署工程师）/ applied AI solutions architect——"技术工作 + 与客户交谈的混合，需求很大，因为客户很多、我们增长很快。但这不是一对一的完美对应。"
与 Emily 的交锋升级到"五年后这个国家什么样、那些人在做什么、如果失业那么严重，革命不就是这么开始的吗"。Dario："对，这正是我们想要防止的结果，绝对是。"他给出三类去处（都不保证）：物理世界的制造/建造（机器人革命存在但比 AI 慢得多）、以人为中心的工作（"人们就是想和真人谈重要的事"）、以及人类对 AI 进行价值与意图对齐的角色（"多薄或多厚很难说"）。
最激烈的反击针对 Jensen Huang"你在混淆 tasks 与 jobs"和"这是让 Anthropic 受益的末日营销"："我想非常清楚地、强硬地反驳。Anthropic 提出了大量想法——经济补助金、经济指数、从税收和宏观政策到新岗位的各种应对。在《技术的青春期》里我用五页讲 tasks 和 jobs 的区别、为什么这次和以往不同、从私人慈善到政府行动的六类做法。"
他把矛头指向社交媒体文化："社交媒体——我作为一个品类厌恶它——人们拿着一年前的 3 秒切片……说这是廉价营销，本身才是廉价营销，是懒惰，是不愿与严肃的智识工作打交道。这是硅谷的疾病，它被困在 3 秒的社交媒体世界里。每当有人这么说，我就更不把他当回事。"

"The idea that this is cheap marketing is itself cheap marketing. This is laziness. This is failure to engage with serious intellectual work." —— Dario Amodei

国防部合同与红线：反战的人为何首个上机密网络

核心要点：Dario 把"反战立场"与"首签国防部合同"的张力，统一在一个公式里——除了会破坏自身价值观的用途，其余都该用。

张力本身：他的反战立场可追溯到 Caltech 时期，却是首批与国防部签约、在美国用于作战的机密网络上运行的 AI 公司之一。
他的世界观转变："世界会变。当我看到俄罗斯入侵乌克兰、看到中国入侵台湾的风险，让我担心的是我们面对一个复苏的威权集团，他们非常激进，我们需要自卫。"他不想要一个"中国和俄罗斯能用 AI 分析所有情报、用 AI 攻击台湾和乌克兰，而我们无法防御"的世界。
他强调动机不是钱："我们当然不是为了钱做这个——抛开 lawfare（法律战）不谈，上政府网络本身就是巨大的麻烦，钱却不多。我们做是因为在乎。"
红线公式（出自《技术的青春期》）："我们应该以一切方式使用这项技术，除了那些破坏我们自身价值观的方式——我们的红线是大规模监控（mass surveillance）和全自主武器（fully autonomous weapons）。这些是我相信会破坏我们价值观的东西。如果民主国家做这些事，那它们赢了也不值得。"
他批评"翻烧饼"式的立场："那种从'我们什么都不和政府做'突然变成'我们和政府做绝对一切'的公司，我不理解。你该选定你的原则并坚守。"
对 Palantir 与具体合作边界的澄清：自 2024 与 Palantir 合作；但"我们不与 ICE 合作——无论通过 Palantir 还是其他任何人；我们不与 CBP 合作；我不相信我们在加沙开展业务。我们非常小心地把合作范围限定在我们相信的事情上。"

"It's not worth democracies winning if democracies do those things." —— Dario Amodei

伊朗女校空袭追问：Claude 是否参与了那次打击

核心要点：面对 150+ 人（多为儿童）死亡的最尖锐追问，Dario 既不确认 Claude 的角色，又反复把它当作"为何必须坚守红线"的最强论据。

事实铺陈（Emily 提出）：Bloomberg 报道 Claude 经 Palantir Maven Smart System 用于对伊朗战争的 AI 辅助打击；2 月一枚美国导弹据报命中伊朗一所女校，150+ 人死亡、多为儿童。Emily 直问："Claude 在那次打击中扮演了角色吗？"
Dario 的回应："我们无法访问、不确切知道这些模型是如何被使用的。显然，战争中发生的错误真的非常可怕，这是一件非常可怕的事。如果这都不能说明我们为何必须为我们不支持的用途挺身而出……我们愿意拿公司的未来去冒险，来限制这些模型如何被使用。"
关键区分："而你说的这个用例甚至没有违反我们的红线。我们担心的是会有一百倍于此的、确实违反红线的用例。"
他把"人类做最终决定"提到核心原则的位置："这里 Claude 是辅助，但人类做最终决定（a human makes the final call）。想象一个世界——不是 Claude，因为我们不允许，而是别人的 AI 模型——AI 直接做决定、人类从未看到。那正是我们挺身反对、为之战斗的东西。"
对"这所学校有网站、Google 一搜就能找到，Claude 难道不该发现吗，这是否说明把技术当战争捷径更可怕"的追问，他退回到原则与知识边界："我不知道 Claude 或任何 AI 扮演了什么角色，这可能依赖我没有的机密知识，但我们确立并且我认为这里被遵守的原则是：人类做最终决定。如果这都不是说明那条原则为何如此重要的例证，我不知道还有什么是。"
他还提出一个公民视角的旁注："美国军方借 LLM 从日均打击 1000 个目标提升到 5000 个"——他支持美国更强的军事能力（"我是爱国者，更强的能力不引发战争而是威慑战争"），但坚持军事决策者可靠、明智地行事"事关美国人民的利益"。他用一个反讽比喻收尾："政府大量使用 Microsoft Excel——你没法现实地说'这个军事行动你能用 Excel，那个不能'。"

"A human made that final call, not Claude. 想象别人的 AI 直接做决定、人类从未看到——那正是我们挺身反对的。" —— Dario Amodei

AI 战争是阻止还是引爆美中冲突：《奇爱博士》的末日机器

核心要点：Dario 判断 AI 在平衡上更可能阻止战争，但前提是对其使用有限制；没有限制时它更可能引爆。

他的净判断："在平衡上它更可能阻止战争。但如果我们对它如何被使用没有任何限制，那我认为它可能更可能引发战争。"
《奇爱博士》（Dr. Strangelove）的类比："那部片的前提是你有一个末日装置，当它认为有核武射向它时就自动发射核武。能出什么错呢？"他把致命的全自主武器与此对应——"冲突发生的方式是双方互相扑向对方、互相误解；当我们对这项技术没有适当监督时，那种意外更可能发生。"
正面情形："如果 AI 以恰当方式使用——甚至不是战争，而是情报收集——假设我们能预测对台湾的入侵或乌克兰的新动向，我们的对手在发动入侵或军事行动前会三思。卓越的情报、卓越的响应能力，真的能威慑冲突。"

"你有一个一旦认为核弹射来就自动发射核弹的末日装置——能出什么错呢？" —— Dario Amodei（引《奇爱博士》）

Mythos：太强不敢发布的网络武器，与"开源可复现/PR 营销"的对决

核心要点：Mythos 能自主走完网络 kill chain，被早期客户称"超级武器、该持枪证才能用、别发布"；Dario 用 Firefox 271 个真实漏洞反击"开源可复现"和"廉价营销"两种质疑。

能力跃迁：Mythos 是 Anthropic 最新最强模型，能自主走完网络攻击的整条 kill chain。最让 Dario 惊讶的是"模型不仅能找漏洞，还能重要地把漏洞转化为 exploit（人们常只谈漏洞、不谈把漏洞武器化），而它相当擅长——这是一次特别大的跳跃"。
来自客户的求停信号："我们几乎没怎么提示，一些早期拿到它的公司就说'这是超级武器，你该有持枪证才能用，请别发布'——是我们给它的公司在求我们别发布，因为它们发现了太多关键漏洞和可利用性。"
但目标不是永久锁起来："世界总会扭曲事情……目标不是永远锁住，我们在逐步对越来越广的人开放，最终我们相信应该把 Mythos 发布给一般受众，但要配强大的网络安全防护。"他点出当下隐忧：已发布的 Opus 4.7 是较弱的网络模型，其分类器防护可被越狱，而一些公司以为这就够了。
对"开源能复现/OpenAI 已有/这是 PR"的逐条反击：
"开源可复现是惊人的假话。有人在 Twitter 上说，如果你把开源模型精确指向 Mythos 找到的那一行代码，它也能找到同样的问题——但那根本不是 prompt、不是问题所在。"他用大海捞针比喻："你找到了那根针所在的确切那一行，别的东西现在能捡起那根针——这不是一回事。"
真实工作流的证据："实际测试是我们去公司、去开源 repo。我们在 Firefox 发现了 271 个新漏洞，在不能披露的私有公司里发现了数千个——之前的模型没有人找到那 271 个。"
对"廉价营销"的反击："我们因为不发布这个非常强大的模型在商业上吃了巨亏。这个模型极大加速了 Anthropic 内部的研究和下一代模型；如果发布，它在外部世界也会这么做。这在商业上严重伤害了我们。"
政府介入与多方拉扯："我们一直在和政府谈，非常尊重他们的建议；他们因为担心反情报风险而放慢我们开放的节奏，我认为这是明智的。"现实张力是："我有客户每天打电话要 Mythos，有国家打电话要 Mythos，又有美国政府和我的安全团队说'等一下，有风险'——我不是说哪一方对，真相在中间，但这是真实的挑战，我们需要作为社会一起面对，而不是指责对方廉价营销。"

"We found 271 new vulnerabilities in Firefox. 之前的模型没有人找到那 271 个。" —— Dario Amodei

政府会不会接管？长期受益信托与"对政府和公司的双向制衡"

核心要点：Dario 认同"政府为何允许私企控制如此强大技术"是严肃问题，但他的答案不是国有化，而是处处都要有制衡——包括一个能炒掉他自己的信托。

历史的异常："每一项强大技术——核武、互联网、GPS、手机——要么由政府建造，要么源于政府（R&D 在联邦实验室和大学）。AI 是第一项在私营部门建造、政府没有真正严肃角色、且姗姗来迟的技术。这是一个危险且不稳定的局面，不是我会选择的局面。"但他认为没有替代方案——"技术能被造出来，我们的对手在造，它有经济价值，它一定会被造出来；问题是政府没在做，而不是私营部门在做。"
公司侧的制衡——长期受益信托（long-term benefit trust）："这是一个机构，能任命多数董事会成员、也能罢免多数董事会成员——本质上若一路穿透，它有权炒掉我。我们在引入一点点公共治理的元素，让你对一个不只是持有公司股票的人负责。无论公司发生什么，这个结构都会延续。我们也鼓励其他公司有类似结构。"
政府侧的制衡："国会有已宣布的努力来立法那些红线。我认为立法和司法分支需要发力，因为这项技术——我害怕公司拥有它，也害怕政府拥有它。公司需要制衡政府，政府需要制衡公司。"
具体监管主张："我们需要技术的基本监管，需要开始做发布前测试、强制的发布前测试，以及对模型的测试和审计。"
他再次用"平滑指数"敲打两个极端："硅谷有一群人，一开始连透明度、出口管制都觉得会'天启式地摧毁我们创造技术的潜力、扼杀创新'；可一旦看到第一个真实危险，又全是'国有化、政府该直接没收'的论调。从最极端的反监管，横跳到完全共产式的'政府全拿走'——我们需要更明智、温和的路径，这正是我们一直偏好的，因为我们理解这项技术的力量，我们不恐慌也不否认。"
与白宫的关系："政府非常认真对待 Mythos，我们和财长 Bessent、幕僚长 Susie Wiles 都有很好的对话，他们真正理解风险的性质。任何一届政府都有相处得好的部分和更难相处的部分，这很正常，我们尽力周旋。"

"它本质上若一路穿透，有权炒掉我。无论公司发生什么，这个结构都会延续。" —— Dario Amodei（谈长期受益信托）

中国、百度经历与开源威胁：前沿的溢价压倒一切

核心要点：Dario 认为远离前沿的"落后模型"经济价值有限（智能有巨大溢价），但它们携带的 Mythos 级网络能力会成为真实的扩散风险；他对华的核心关切是地缘政治与高科技威权。

前沿溢价论："这项技术有一个对'模型多聪明'的真实溢价，我们极少看到人们偏好用更低智能的模型。"他承认存在繁荣的、对低端模型友好的生态，但"这是指数——远离前沿的模型可能有相当于 2023、2024 年的经济价值，但以 10x/年的增长，前沿上的东西总是远大于离前沿的东西"。
对旧产品时代直觉的批评："习惯于在上一个时代建产品的人不太理解这点。作为一个之前没运营过公司、从没想过上一个产品时代（尤其社交媒体时代）的人，我觉得自己是那个世界的局外人，而我觉得人们的直觉是错的——智能是如此巨大的因素，它压倒其他一切。"
真实的扩散担忧："我担心的是这些落后模型的风险——我们现在有 Mythos 级网络能力，12 个月后会有强得多的；但 Mythos 级的网络能力可能就变成任何人都能下载的了。希望那之前我们已经补好所有漏洞。我不认为我们能阻止它，但这是个严肃的担忧。"
百度（Baidu）经历："我在那儿工作了一年，大概更多学到的是语音识别。唯一让我担心的是，我们获得所有语音识别数据的部分方式是——他们不祥地说'我们在中国不在乎隐私，所以有这么多语音识别数据'。"
真正的关切是地缘与人权："最让我担心中国发生的事是维吾尔人遭遇的、对批评的压制——甚至在美国，香港发生的事，CCP 能伸进美国商业网络压制批评。这是一个威权国家、一个高科技威权国家；当我看到它与 AI 结合，你真的得到一个反乌托邦，1984 或更糟。"
他的使命落点："我的焦点是努力防止那个，我认为我们有机会防止。我认为我们有机会让 AI 成为一项亲民主的技术，让人们更自由、兑现'人人享有平等正义'的承诺；或者它走向另一边。走哪条路，取决于 AI 公司、政府和我们所有人的行动。"

"在中国不在乎隐私，所以我们有这么多语音识别数据——他们是这么不祥地说的。" —— Dario Amodei（回忆百度）

递归自我改进：没有"那个时刻"，只有加速的指数

核心要点：Dario 拒绝"AI 自我改进的奇点时刻"叙事，代之以"连续加速的指数"，并把它当作识别"谁不严肃"的试金石。

他否认有一个时间点："我不认为它是时间中的一个时刻，我认为它是一个连续过程。我们已经在某些方面看到 AI 能为下一代 AI 建议架构。"
量化进展："一年前我们看到 AI 带来的全要素生产率（TFP）增益大概 10-15%，现在可能到 20-30%，可能在翻倍。和所有事一样，我们在指数上。没有一个 AI 自我改进、失控或变得不安全的时刻；我们有的是一个加速的指数，在曲线的每一点，我们都得评估：是不是该减速了？是不是该对这项技术加更多控制了？我认为越来越多这样的控制会成为必需。"
这条曲线是他的"罗塞塔石碑"，也是他对两类人的"对象教训"：反对一切 AI 监管、然后看到一件事就想国有化的人；以及轻视 AI 力量、然后突然'天哪它在自我改进、失控了、我们得全部关停'的人。"在这两种极端反应之间横跳极其无益。明智的回应是：我们不会恐慌，我们的反制措施会随技术的力量平滑地逐级提升。如果你看到某人有这种疯狂的横跳反应，那是他被打了个措手不及、不严肃的信号。"

"There's no moment where AI improves itself or runs out of control. 我们有的是一个加速的指数。" —— Dario Amodei

自比西拉德而非奥本海默：制衡哲学与 10-25% 的崩溃概率

核心要点：在全场收束处，Dario 用《原子弹的制造》给出他的领导哲学——不要"比生命更大"的中心人物，要处处制衡；并直面他自己给出的 10-25% 文明崩溃概率。

最爱的书是《原子弹的制造》（The Making of the Atomic Bomb）。被问是否在自己和 Oppenheimer 之间看到相似，他给出一个反直觉的选择："我最认同的人物是 Leo Szilard（利奥·西拉德），第一个基本提出可能存在链式反应的人。"
他的领导哲学："我们不会靠'比生命更大'的人格、或试图站在一切中心的人物闯过这关。这里需要权力的平衡——有很多有利益的强大行动者，唯一让所有人都有好结局的方式，是基本上处处都有制衡。所以在某些方面，我其实把 Oppenheimer 看作一个失败案例、看作不该发生的事。"
直面崩溃概率：Emily 引他自己的说法——"大约 10-25% 的文明崩溃概率，这不是个小数字。有没有一种情景，是 Anthropic 造的东西导致了它？"Dario："我当然希望不是。我的看法是我们采取的行动降低了那个概率而非抬高它。那个概率来自技术非常直接的配方、世界上存在许多国家、一个经济体里存在许多公司（若空缺没被填补还会有新公司产生）——这是我们身处的困境。我们在努力降低概率，我认为我们降低的远比抬高的多。"
但他承认无法归零："这项技术的固有属性是不可预测。我们尽量在发布前大量测试，今天发布的模型不危险，或至少在网络之外不真正危险，然后我们迭代、学习。公司里我们做的事有一半是尽力降低风险，但它永远不会是零。"
收尾的航空公司比喻：你可以造一家比所有同行安全 10 倍的航空公司，但若有人问"你能保证飞机永不坠毁吗"，你怎么可能保证？"但如果有 25% 的坠机概率，你不会上那架飞机。" Emily 接："没错，25% 太高了。" Dario："我们在努力把那个概率变得低得多得多，那就是目标。"
对最后的"你在造极强的东西并将从中巨额获益，我们为什么该信任你"，他的回答是把信任落到"行动史"上："从不信任的位置出发是相当理性的——硅谷已失去世界很多信任、必须重新赢回。我们要传递的信息是我们真的不同，而这必须靠我们实际做的事来赢得：我们为价值观挺身（Mythos 严重拖累了我们的商业）；更早还有一堆小事，比如在中国问题上我们身体力行——切断了模型访问，没人要求我们这么做，那在当时损失了几亿美元、而几亿是我们营收的相当大一部分；还有 Claude 2 的延迟……我们不完美、会犯错，但我请人们看整体历史，问'与这段整体历史最一致的假设是什么'。我认为一致的假设是：我们真心在努力做对的事。"
纪录片在轻松一刻收尾：Emily 说"我们会在指数的另一边见到你"，Dario 笑答"但愿如此"。被打趣"你总想当好莱坞明星"，他自嘲 CEO 工作最意外的一件事是"要多频繁地化妆——这不在我的 bingo card 上"。

"我最认同的人物是 Leo Szilard……在某些方面，我把 Oppenheimer 看作一个失败案例、看作不该发生的事。" —— Dario Amodei

附录：关键人/机构/产品/数据

项目	详情
Dario Amodei	Anthropic 联合创始人兼 CEO；前生物学家；曾在百度工作约一年；反战立场可追溯至 Caltech
Emily Chang	本片采访者
Daniela Amodei	Dario 的妹妹、Anthropic 联合创始人；Claude 曾诊断出她被名医漏诊的病
Holden Karnofsky	Daniela 的丈夫；Open Philanthropy 主理人；2016 年三人同住 group house
Demis Hassabis	Google DeepMind，做 Gemini 与 AlphaFold；Dario 认识他 15 年，互换安全理念
Sam Altman	OpenAI CEO；印度峰会"拒绝牵手"事件另一主角
Jensen Huang（黄仁勋）	批评 Dario"混淆 tasks 与 jobs"、暗指"末日营销"
Leo Szilard（西拉德）	链式反应概念提出者；Dario 最认同的历史人物
Oppenheimer（奥本海默）	Dario 视其为"失败案例/不该发生的事"
Bessent	美国财政部长；与 Anthropic 就 Mythos 有良好对话
Susie Wiles	白宫幕僚长；理解 Mythos 风险
Anthropic	Dario 的公司；成为营收与估值最高的 AI 公司
OpenAI	Dario 离开的公司；签下了他拒签的国防合同
Palantir	自 2024 合作；其 Maven Smart System 涉伊朗 AI 辅助打击
Baidu（百度）	Dario 工作约一年做语音识别；"中国不在乎隐私"数据来源
Claude Code / Claude co-work	两个 hit 产品；co-work 发布引发"SaaS 末日"
Mythos	最新最强模型，能自主走完网络 kill chain；"太强不敢发布"
Opus 4.7	已发布的较弱网络模型，其防护可被越狱
长期受益信托	可任免多数董事会成员，理论上能炒掉 Dario
《技术的青春期》	Dario 著作，含 tasks vs jobs、六类应对方案
《原子弹的制造》	Dario 最爱的书
$2850 亿	Claude co-work 发布后一夜蒸发的市值（"SaaS 末日"）
近 1 万亿美元	Anthropic 估值（Bloomberg 报道，高于 OpenAI）
10x/年	Anthropic 规划的算力增长
季度 >3x ≈ 年化 80x	2026 Q1 实测营收增速（远超计划）
半数入门级白领岗位	Dario 称 AI 可能在 1-5 年内消灭（一年前论断）
1000 → 5000 个目标/天	美军借 LLM 提升的日均打击目标数
271 个	Mythos 在 Firefox 发现的新漏洞数
150+ 人	伊朗女校空袭据报死亡人数（多为儿童）
TFP 10-15% → 20-30%	AI 带来的全要素生产率增益（一年内变化）
10-25%	Dario 自估的文明崩溃概率
token 税（token tax）	Dario 提出的应对失业的政策构想