← 返回
VIDEO INSIGHT

Inside the Mind of Anthropic CEO Dario Amodei

节目
嘉宾
日期
2026-06
时长
70 min

概要

  • "平滑的指数曲线"是 Dario 理解整个世界的元框架。他把当下的体感比作"以相对论速度飞离地球":你睡一觉醒来地球上过了两天,再睡一觉过了三天、四天——加速度本身在加速。Anthropic 成为营收和估值最高的 AI 公司,对他"既不意外(图上只是一条平滑的线),又充满意外(真正发生时细节和色彩远超想象)"。这条曲线也是他评判他人是否"严肃"的标尺:在"毫不担心"和"今天就要恐慌"之间来回横跳(yo-yoing)是不成熟决策的标志。
  • 离开 OpenAI 的真正原因是信任崩塌,而非安全分歧。Dario 罕见地直说:安全上的分歧人人都有,"光是分歧不足以让人离开";真正让他走的是"当你感到无法信任某人、感到他们的价值观不是他们说的那样、感到他们不诚实、看到令人不安的行为模式"。他对"我们各干各的、市场和公众舆论会决出胜负"完全平静。
  • 押注企业级与 coding 而非消费级 splashy apps,是价值观与商业模式的刻意对齐。Claude Code、Claude co-work 都成了 hit;Claude co-work 发布后一夜 $2850 亿市值蒸发,被交易员称为"SaaS 末日"。他判断软件业整体会变大不变小(蛋糕做大 10x,既有玩家涨 1.5x 也算落后),但拒绝绝症式预测。
  • 失业警告被 3 秒切片扭曲,他强烈反击"末日营销"指控。他坚持自己一年前"1-5 年内消灭一半入门级白领岗位"的论断本就是"展示事情能有多疯狂的数量级",且每次都同时谈解决方案(token 税、转岗、宏观政策)。对 Jensen Huang"混淆 tasks 与 jobs"和"廉价营销"的批评,他回击"说这是廉价营销本身才是廉价营销,是懒惰,是不愿严肃思考"。
  • 在国防、伊朗女校空袭、Mythos 网络武器三件事上,Dario 把"红线哲学"推到了最尖锐处。他是首批与国防部签约上机密网络的 AI 公司 CEO,却因划下"反大规模监控、反全自主武器"红线被总统禁入联邦政府、被五角大楼贴"供应链风险"标签、被 OpenAI 抢走合同。面对伊朗女校 150+ 人(多为儿童)死亡的追问,他反复回到一条原则:"人类做最终决定"。
  • 贯穿全场的主线是"平滑的指数 + 制衡"这对组合拳:因为相信曲线平滑可预测,所以反对恐慌式监管也反对放任;因为相信权力会失控,所以既要长期受益信托能炒掉自己、也要立法和司法对政府与公司双向制衡。他自比《原子弹的制造》里提出链式反应的 Leo Szilard,而把 Oppenheimer 视为"不该发生"的失败案例——拒绝做站在一切中心的"比生命更大"的人物。他自估文明崩溃概率 10-25%,并坚称 Anthropic 的行动是在降低而非抬高这个数字。
01

"平滑的指数曲线":从相对论飞船到睡眠管理

核心要点:Dario 用一个统一的隐喻——平滑的指数曲线——同时解释他的失眠、他的世界观、和他对"成熟决策"的定义。

  • 开场 Emily 问"你睡多少?",Dario 承认自己从来睡得不好,"正在学习在异常压力下放松和入睡的艺术"。
  • 他对"内部感觉如何"的回答是整场访谈的题眼:想象你以相对论速度飞离地球,"你睡一觉醒来地球上过了两天,于是你得在一天里处理两天的事;再睡一觉,因为持续加速,过了三天;下一天是四天——感觉就有点像这样。"
  • 但他拒绝"半夜醒来惊恐于会面对什么"的状态:"偏执或担心醒来会面对什么,是没有生产力的。"他援引历史上处理高压情境的人:要像外科医生面对手术、军官面对军事行动那样理性回应,"维持一种基本的平静"。
  • 他把"在'我不担心'和'天哪我们今天必须恐慌'之间来回横跳"明确定义为"不成熟决策的标志";成熟的决策是"你不能忽视它、不能自满,事实上风险正越来越大,但你必须理性回应"。
  • Anthropic 成为营收与估值第一的 AI 公司,对他是同一条曲线的兑现:"我看着这张图想,我们大概会在这个时间点左右成为营收和估值最高的 AI 公司——果然发生了。一方面我不意外,因为图上只是一条平滑的线;另一方面,真正发生时你看到太多细节和色彩,它确实令人惊讶。"
"Nothing's happening. Nothing's happening. 一点小事发生,然后 Zoom——它就疯了。这就是这个世界的体验。" —— Dario Amodei
02

旧金山童年:不墨守成规(nonconformism)如何塑造一个 AI CEO

核心要点:Dario 把自己"有连贯世界观就该去追,哪怕所有专家都反对"的胆量,追溯到旧金山的个人主义土壤。

  • 父亲是皮匠(leather craftsman),母亲在图书馆工作。互联网革命就在身边发生,"我却完全没兴趣"——他只对数学、理解宇宙、科幻感兴趣,"对世界充满好奇"。
  • 他认为旧金山"不墨守成规、个人主义、可以很疯狂也没关系"的精神确实影响了他。他对硅谷有很多尖锐批评,但欣赏其中一点:"哪怕所有专家都反对你也没关系;只要你有一个连贯的愿景和世界观,你就该去追求它。也许根本行不通,但如果成了,这里有一种长尾性——某些矿脉里你可能挖到一座巨大的金矿。"
  • 一段被采访者用来切入的私人史:2016 年,Dario、妹妹 Daniela 及其丈夫 Holden Karnofsky 同住一栋 group house。当时 Open Philanthropy 刚起步(Holden 主理),Dario 还是生物科学家,帮他们做发展中世界健康和生物研究方向的评估——"哪些领域有前景,哪些没那么有前景"。
"It's okay to be crazy——我想这其中很大一部分确实沾染到了我身上。" —— Dario Amodei
03

离开 OpenAI:不是安全分歧,是信任崩塌

核心要点:Dario 第一次如此直白地区分"安全分歧"与"信任崩塌"——前者人人都有,后者才是他离开的真正原因。

  • 当 Emily 问"超越叙事,到底发生了什么、你们在什么问题上不合",Dario 先发出一声轻蔑的"snort",然后说"我要非常简单地说"。
  • 他承认建造强大技术时有许多艰难议题,Anthropic 每天都面对、不知道决策是对是错;"安全上有很多正当的分歧,我们确实和他们有过一些。但光是这个不足以让人离开。这里的人也和我有分歧、彼此有分歧。"
  • 转折点是信任:"当你感到无法信任某人、感到他们的价值观不是他们所说的那样、感到他们不诚实、感到他们不是为了他们声称的理由而做、当你看到令人不安的行为模式、不诚实——这让你很难继续与一家公司合作、继续信任它。"
  • 他的态度是彻底的平静与切割:"当你没有相同愿景、又不信任对方时,为什么要争论?解决方式就是你去做你的事,他们去做他们的事。我完全心平气和。我们会看谁在市场上赢,谁在公众舆论的法庭上赢——这些比任何关于谁离开了什么的戏剧都更响亮。"
"People here have had disagreements with me... But when you feel that you can't trust someone, that makes it very hard to continue to work with a company." —— Dario Amodei
04

印度峰会"拒绝牵手"与 race to the top(向上竞赛)

核心要点:面对"连建造最重要技术的人都不能在台上牵手,怎么相信你们会在生存风险上合作"的尖锐追问,Dario 用"可信玩家联手挤压不可信玩家"的机制作答。

  • 名场面还原:印度 AI 峰会上,Dario 与 Sam Altman 似乎拒绝在台上牵手。Dario 的解释是峰会"极度混乱"——"我们都最后一刻才上台,他们又改了我们站的顺序,给我们拍照,然后命令我们都牵手。"他补充"突然 Narendra Modi 在台上让所有人牵手",全场被逗笑。Emily 不依不饶:"可别人都牵了,得了吧。"
  • 但他随即把话题拉回严肃:"建造这项技术的人,在质量和可信度上存在巨大差异。那种'没人信任彼此'的 meme,我不认为是对的。"他举证:认识做 Gemini 的 Demis Hassabis 已 15 年,"我们一起处理过若干议题,我们从 Google 买算力,我们一直在交换安全理念。"
  • 他的核心机制是 race to the top 的"胡萝卜+大棒":
  • 胡萝卜(正向激励):"Demis 做 AlphaFold,我们也想在生物上做点什么;我们做可解释性研究,他们也开始做可解释性研究。这甚至不是竞争——一家公司做了很酷的事,另一家说'那很酷,我们也想做'。"
  • 大棒(隐性压力):可信的多数若都做对的事,不可信者就被置于"不得不采纳同样标准"的境地;他们常常"一边勉强做对的事,一边假装在做不同的事、并暗示我们有什么阴险之处"——"这是可以预期的,但这正是我们让整个行业团结、合作的方式。"
"可信的行动者需要联合起来,把不可信的行动者逼到一个不得不采纳同样标准的位置。" —— Dario Amodei
05

押注企业级而非消费级:商业模式必须与价值观对齐

核心要点:Dario 把"做 coding 和企业级、不做 splashy 消费 app"讲成一个价值观选择——因为消费模式天然激励上瘾,而企业模式天然激励信任与长期关系。

  • 他的底层逻辑:"如果你选一个与价值观根本冲突的商业模式,你会很难——要么背叛自己的价值观,要么变得无关紧要,陷入 catch-22。远比这好的是选一个与价值观兼容的模式。"
  • 为什么不做消费:他点名社交媒体和消费世界"鼓励参与度、甚至上瘾";"我们看到的 AI 视频模型的 slop(垃圾内容),目的就是最大化你付出注意力的分钟数,因为那是广告驱动的激励。"
  • 为什么企业级与价值观协同:他把"用 AI 治愈以前治不了的病、让能源更便宜、帮助教育、解决发展中世界健康、提升经济增长"这些他眼中 AI 最大的正面价值,几乎全部归到企业(含非营利)名下。
  • 另一层是信任结构:"企业非常看重信任和长期关系——你和一家公司合作很多年,你兑现承诺,他们兑现承诺,他们基本上信任你。这与我们以正面、安全的方式部署模型的目标高度协同。"
  • 他承认仍想更纯粹做企业级,但消费端"在我们没投入那么多精力的情况下也开始快速增长"。一个家庭场景的幽默插曲:他儿子昨天问"能用你的 Claude co-work 账号吗?"Dario 说"绝对不行,我需要我的 token。"
"选一个与你价值观根本冲突的商业模式,你要么背叛价值观,要么变得无关紧要。" —— Dario Amodei
06

模型质量是唯一护城河,"SaaS 末日"与软件业变大不变小

核心要点:Dario 拒绝依赖"黏性",只押注模型质量;他预测 SaaS 会有大输家,但软件业整体的蛋糕会变大。

  • 面对"开发者一下午就能从 Claude 切到 GPT 或 Gemini,真能有长期领先吗",他回答:"模型质量是最重要的事,我们现在在模型质量上遥遥领先。有一定的惯性,但我从不依赖它——Anthropic 从不依赖'这东西有黏性、人们不会切换'。你要有更好的模型、更好的产品。"他补充截至录制时增长率"完全没有拐头,如果有的话还在上升"。
  • "SaaS 末日"事件:Claude co-work 发布后不久,$2850 亿(285 billion)市值一夜蒸发,交易员称之为"SaaS apocalypse"。
  • 他对软件业命运的判断是反直觉的"蛋糕变大"论:
  • 会消失的护城河:"快速写复杂软件"的能力——"如果你的护城河是'我们写了别人写不出的复杂软件',那祝你好运,你守不住。"
  • 会留下甚至更重要的护城河:客户关系、行业 know-how、独特领域知识。
  • 他给所有 SaaS 公司的建议:"列出你所有的护城河,清楚知道有些会消失、另一些会因为成为限制因素而相对更重要,可能还有新的护城河出现。"
  • "蛋糕变大"的数学:"如果 AI 能让可能性增长 10x,一个既有行业很容易涨 1.5x——只是没有整块大蛋糕涨得快。"所以软件业会变大不变小,"尽管会有一些大输家——那些把头埋进沙子、不适应的人会非常难过。"
"做大的不是某一家,是整块蛋糕。既有巨头在相对意义上可能变小,有些甚至会倒闭,如果他们不以正确的方式适应。" —— Dario Amodei
07

万亿估值与算力爬坡:为什么需要这么多钱

核心要点:Dario 用"算力爬坡的不确定性锥"为近万亿估值辩护,并披露 2026 Q1 出现了远超计划的 80x 年化增速。

  • 金主与张力:最大支持者是 Amazon、Google、Microsoft、Nvidia——既是合作伙伴又是对手,各有议程,且有与融资挂钩的巨额商业里程碑。Emily 问"到底谁说了算?"
  • Dario 的反例论证是对华芯片出口管制:"我一直直言需要对华芯片出口管制,因为中国在 AI 能力上领先对美国、对世界民主状态都会非常糟糕。一些芯片制造商显然不同意,但这没阻止我说出来——即便我们签了更多合作,我现在还在说。他们知道我们总是与他们合作、是好伙伴;他们大概希望我们别说这些,但这些就是我相信的。我们都是成年人,可以在一件事上合作、在另一件事上分歧。"
  • 估值辩护:Bloomberg 报道其估值高于 OpenAI、近 1 万亿美元(一家 5 岁创业公司)。他的逻辑是算力爬坡极快带来的"不确定性锥"——"一年后你会有三四倍的算力……融资是对这个不确定性锥的缓冲。这是完全理性的事,对业务的稀释非常小,而且逻辑上与基本面有问题完全是两回事,事实上恰恰相反。"
  • 关键数据披露:Anthropic 原本规划算力 10x/年增长("10x a year 是我们的预期");但 2026 第一季度看到的是"季度营收 >3x(未年化),而 3 的四次方是一年 80x"。"我们没规划 80x 的年化增长,规划那个也不理性——因为如果你只拿到 10x,你就多买了 8 倍。所以我们正处在一个局部极端的算力爆炸里,这不会持续;如果持续,到年底的营收数字是地球上没有公司能达到的。"
  • 对"服务器吃紧、用户抱怨 token 用完、你说别家在算力上 yolo"的回应:"算力是有市场的……在比几个月更长的时间里,我们能拿到大量算力。按任何合理标准我们都没买太少。"
"这些算力爬坡非常快,融资是对这个不确定性锥的缓冲——它是完全理性的,而且与基本面有问题恰恰相反。" —— Dario Amodei
08

规模化后如何坚守价值观:一半时间在讲文化

核心要点:Dario 认为"好模型"恰恰是 Anthropic 得以在扩张中坚持价值观的杠杆;而最大的威胁不是创始人变心,而是公司成分变化太快。

  • 对"当你是 underdog 时占据道德高地容易,到这个规模有多难坚守",他的回答是把商业成功与价值观看成协同而非对立:"我实际上把'我们能做出这么好的模型'看作让我们能在公司变大时依然主张价值观的东西。"
  • 真正的风险来自人员成分:"不是因为我、联合创始人或公司领导的价值观变了,而是公司的成分变化非常快。当你增长这么快、从大科技公司招一堆人,如果你不告诉他们 Anthropic 怎么运作,他们只会复刻他们唯一知道的东西——他们原来公司的运作方式。"
  • 因此他"大概把一半时间花在跟公司讲 Anthropic 的文化、文化如何运作"。他说这是"我和 Daniela 也许排第一的首要任务,因为我们认识到这是长期意义上我们是谁的核心"。
"我在每个规模上都偏执。公司每到一个规模都有新挑战、新的方式让它失去取胜的意志或价值观的内核。" —— Dario Amodei
09

产品速度的两个引擎:统一文化 + 用 Claude 造 Claude

核心要点:Dario 把"出货快得离谱"归因于两件事——组织/文化的高度统一,以及 Claude 自身正在加速模型与产品开发。

  • 第一引擎:"我们有一家统一的公司、统一的文化。我们变大了却依然极其高效、所有人还在同一页上——文化和组织的统一,我认为这是最大的因素。"
  • 第二引擎:"Claude 本身——我们现在用 Claude 帮助开发模型、让它们更高效、快速开发产品。有各种新做法要建立,我们还很新,但它正在产生大量加速,而且越来越是可靠的加速。"
10

见过最疯狂的 AI:Claude 诊断出名医漏诊的病,与"一个世纪的进步"

核心要点:这是全场最有体感的"乐观"段落——Dario 以前生物学家的身份,对 AI 在生物医学上的跃进发出由衷的"wow"。

  • 故事核:"我见过最疯狂的一些事是在生物和医学领域。包括 Daniela 本人在内,我见过若干案例,Claude 诊断出了一堆名医(fancy doctors)漏掉的医学问题。"
  • 专业视角的震撼:"在生物这边,模型在药物设计、计算化学这类任务上开始好得惊人。作为一个曾经的生物学家,我看着想——wow,这很难,你需要大量训练才能做,而 Claude 正在变得擅长。"
  • 由此引出他的宏愿,被 Emily 接话:"a century of scientific progress(一个世纪的科学进步)。" Dario 补全:"一个世纪的科学进步,加上一个世纪的'作为人是什么体验'的进步。回到 1900 年,想想那时所有的问题、人们过早死亡的原因、所有的苦难和物质匮乏;再想象一百年这样的进步。我真心相信这个世纪的科学和医疗进步——如果我们能闯过去,我越来越乐观我们会——我们将拥有一个好得多得多的世界。"
"Claude diagnosed a medical problem that a bunch of fancy doctors had missed." —— Dario Amodei
11

写作与 Claude:用作头脑风暴而非代笔,守住思考的红利

核心要点:以 essay 著称的 Dario 拒绝让 Claude 直接代写,因为写作本身是他厘清思考、与他人建立共同参照点的方式。

  • 他承认用 Claude,但"还没到允许 Claude 直接写的文字进入(成稿)的地步,因为我有非常特定的风格、有点挑剔"。Claude 的角色是支持性的:"帮我头脑风暴、帮我想透主题、帮我想'有哪些参考可以用'。"
  • 他坦言不知道距离"Claude 写得比我好"还有多远:"我们还没到那一步,但我认为它肯定会来。"
  • 关于"代笔会不会让我们失去批判性思考",他的回答触及更深的点:"这正是我自己写作的一半原因。我写作不只是为了外部读者(很多人读我写的东西),同样是为了厘清我自己的思考、知道下一步做什么,并在我和他人之间创造一个共同的参照点。如果我们端到端地用它——'写一篇关于 AI 风险的 essay'——首先它不会写出我所想的东西,其次我会恰好失去那个红利。"
  • 他认为随着模型变好,"大概有办法更直接地用它来写作、同时仍保留那些红利,但这会是个微妙的事,得随时间摸索"。
"我写作同样是为了厘清自己的思考——如果让它端到端代写,我会恰好失去那个红利。" —— Dario Amodei
12

失业论:半数入门白领岗位、tasks vs jobs、与"末日营销"的正面交锋

核心要点:Dario 坚持自己的失业警告从来都"同时附带解决方案",并对"doom marketing"的指控发起全场最激烈的反击。

  • 他重申那句被反复掐头去尾的话:"AI 可能在 1-5 年内消灭一半入门级白领岗位"——"那是一年前说的。"对"现在是否还是 50% 还是更高",他强调原话始终是"我不知道会发生什么,但这是一个关于事情能有多疯狂的数量级",且"从一开始我就在谈应对:token 税、与企业合作转岗,我对再培训项目有点怀疑但也该放进组合里,还有宏观经济政策"。
  • 他的机制模型来自著作《技术的青春期》(adolescence of technology):"你自动化一份工作的 90%,很好,人们在剩下 10% 上效率提升 10 倍,因为他们的杠杆放大了 10 倍;但最终它逼近 100%,那时你就得为他们找别的事做。长期我真的不确定。"
  • Anthropic 内部的活样本:软件工程师正在经历这个转变——"现在 AI 让软件工程师更高效,即便 AI 写了几乎全部代码;但我们已经开始看到苗头,可能有些人 AI 已经不再让他们更高效,而是让 AI 直接做这件事更好。"另一面是新需求岗位:forward deployed engineer(前向部署工程师)/ applied AI solutions architect——"技术工作 + 与客户交谈的混合,需求很大,因为客户很多、我们增长很快。但这不是一对一的完美对应。"
  • 与 Emily 的交锋升级到"五年后这个国家什么样、那些人在做什么、如果失业那么严重,革命不就是这么开始的吗"。Dario:"对,这正是我们想要防止的结果,绝对是。"他给出三类去处(都不保证):物理世界的制造/建造(机器人革命存在但比 AI 慢得多)、以人为中心的工作("人们就是想和真人谈重要的事")、以及人类对 AI 进行价值与意图对齐的角色("多薄或多厚很难说")。
  • 最激烈的反击针对 Jensen Huang"你在混淆 tasks 与 jobs"和"这是让 Anthropic 受益的末日营销":"我想非常清楚地、强硬地反驳。Anthropic 提出了大量想法——经济补助金、经济指数、从税收和宏观政策到新岗位的各种应对。在《技术的青春期》里我用五页讲 tasks 和 jobs 的区别、为什么这次和以往不同、从私人慈善到政府行动的六类做法。"
  • 他把矛头指向社交媒体文化:"社交媒体——我作为一个品类厌恶它——人们拿着一年前的 3 秒切片……说这是廉价营销,本身才是廉价营销,是懒惰,是不愿与严肃的智识工作打交道。这是硅谷的疾病,它被困在 3 秒的社交媒体世界里。每当有人这么说,我就更不把他当回事。"
"The idea that this is cheap marketing is itself cheap marketing. This is laziness. This is failure to engage with serious intellectual work." —— Dario Amodei
13

国防部合同与红线:反战的人为何首个上机密网络

核心要点:Dario 把"反战立场"与"首签国防部合同"的张力,统一在一个公式里——除了会破坏自身价值观的用途,其余都该用。

  • 张力本身:他的反战立场可追溯到 Caltech 时期,却是首批与国防部签约、在美国用于作战的机密网络上运行的 AI 公司之一。
  • 他的世界观转变:"世界会变。当我看到俄罗斯入侵乌克兰、看到中国入侵台湾的风险,让我担心的是我们面对一个复苏的威权集团,他们非常激进,我们需要自卫。"他不想要一个"中国和俄罗斯能用 AI 分析所有情报、用 AI 攻击台湾和乌克兰,而我们无法防御"的世界。
  • 他强调动机不是钱:"我们当然不是为了钱做这个——抛开 lawfare(法律战)不谈,上政府网络本身就是巨大的麻烦,钱却不多。我们做是因为在乎。"
  • 红线公式(出自《技术的青春期》):"我们应该以一切方式使用这项技术,除了那些破坏我们自身价值观的方式——我们的红线是大规模监控(mass surveillance)和全自主武器(fully autonomous weapons)。这些是我相信会破坏我们价值观的东西。如果民主国家做这些事,那它们赢了也不值得。"
  • 他批评"翻烧饼"式的立场:"那种从'我们什么都不和政府做'突然变成'我们和政府做绝对一切'的公司,我不理解。你该选定你的原则并坚守。"
  • 对 Palantir 与具体合作边界的澄清:自 2024 与 Palantir 合作;但"我们不与 ICE 合作——无论通过 Palantir 还是其他任何人;我们不与 CBP 合作;我不相信我们在加沙开展业务。我们非常小心地把合作范围限定在我们相信的事情上。"
"It's not worth democracies winning if democracies do those things." —— Dario Amodei
14

伊朗女校空袭追问:Claude 是否参与了那次打击

核心要点:面对 150+ 人(多为儿童)死亡的最尖锐追问,Dario 既不确认 Claude 的角色,又反复把它当作"为何必须坚守红线"的最强论据。

  • 事实铺陈(Emily 提出):Bloomberg 报道 Claude 经 Palantir Maven Smart System 用于对伊朗战争的 AI 辅助打击;2 月一枚美国导弹据报命中伊朗一所女校,150+ 人死亡、多为儿童。Emily 直问:"Claude 在那次打击中扮演了角色吗?"
  • Dario 的回应:"我们无法访问、不确切知道这些模型是如何被使用的。显然,战争中发生的错误真的非常可怕,这是一件非常可怕的事。如果这都不能说明我们为何必须为我们不支持的用途挺身而出……我们愿意拿公司的未来去冒险,来限制这些模型如何被使用。"
  • 关键区分:"而你说的这个用例甚至没有违反我们的红线。我们担心的是会有一百倍于此的、确实违反红线的用例。"
  • 他把"人类做最终决定"提到核心原则的位置:"这里 Claude 是辅助,但人类做最终决定(a human makes the final call)。想象一个世界——不是 Claude,因为我们不允许,而是别人的 AI 模型——AI 直接做决定、人类从未看到。那正是我们挺身反对、为之战斗的东西。"
  • 对"这所学校有网站、Google 一搜就能找到,Claude 难道不该发现吗,这是否说明把技术当战争捷径更可怕"的追问,他退回到原则与知识边界:"我不知道 Claude 或任何 AI 扮演了什么角色,这可能依赖我没有的机密知识,但我们确立并且我认为这里被遵守的原则是:人类做最终决定。如果这都不是说明那条原则为何如此重要的例证,我不知道还有什么是。"
  • 他还提出一个公民视角的旁注:"美国军方借 LLM 从日均打击 1000 个目标提升到 5000 个"——他支持美国更强的军事能力("我是爱国者,更强的能力不引发战争而是威慑战争"),但坚持军事决策者可靠、明智地行事"事关美国人民的利益"。他用一个反讽比喻收尾:"政府大量使用 Microsoft Excel——你没法现实地说'这个军事行动你能用 Excel,那个不能'。"
"A human made that final call, not Claude. 想象别人的 AI 直接做决定、人类从未看到——那正是我们挺身反对的。" —— Dario Amodei
15

AI 战争是阻止还是引爆美中冲突:《奇爱博士》的末日机器

核心要点:Dario 判断 AI 在平衡上更可能阻止战争,但前提是对其使用有限制;没有限制时它更可能引爆。

  • 他的净判断:"在平衡上它更可能阻止战争。但如果我们对它如何被使用没有任何限制,那我认为它可能更可能引发战争。"
  • 《奇爱博士》(Dr. Strangelove)的类比:"那部片的前提是你有一个末日装置,当它认为有核武射向它时就自动发射核武。能出什么错呢?"他把致命的全自主武器与此对应——"冲突发生的方式是双方互相扑向对方、互相误解;当我们对这项技术没有适当监督时,那种意外更可能发生。"
  • 正面情形:"如果 AI 以恰当方式使用——甚至不是战争,而是情报收集——假设我们能预测对台湾的入侵或乌克兰的新动向,我们的对手在发动入侵或军事行动前会三思。卓越的情报、卓越的响应能力,真的能威慑冲突。"
"你有一个一旦认为核弹射来就自动发射核弹的末日装置——能出什么错呢?" —— Dario Amodei(引《奇爱博士》)
16

Mythos:太强不敢发布的网络武器,与"开源可复现/PR 营销"的对决

核心要点:Mythos 能自主走完网络 kill chain,被早期客户称"超级武器、该持枪证才能用、别发布";Dario 用 Firefox 271 个真实漏洞反击"开源可复现"和"廉价营销"两种质疑。

  • 能力跃迁:Mythos 是 Anthropic 最新最强模型,能自主走完网络攻击的整条 kill chain。最让 Dario 惊讶的是"模型不仅能找漏洞,还能重要地把漏洞转化为 exploit(人们常只谈漏洞、不谈把漏洞武器化),而它相当擅长——这是一次特别大的跳跃"。
  • 来自客户的求停信号:"我们几乎没怎么提示,一些早期拿到它的公司就说'这是超级武器,你该有持枪证才能用,请别发布'——是我们给它的公司在求我们别发布,因为它们发现了太多关键漏洞和可利用性。"
  • 但目标不是永久锁起来:"世界总会扭曲事情……目标不是永远锁住,我们在逐步对越来越广的人开放,最终我们相信应该把 Mythos 发布给一般受众,但要配强大的网络安全防护。"他点出当下隐忧:已发布的 Opus 4.7 是较弱的网络模型,其分类器防护可被越狱,而一些公司以为这就够了。
  • 对"开源能复现/OpenAI 已有/这是 PR"的逐条反击:
  • "开源可复现是惊人的假话。有人在 Twitter 上说,如果你把开源模型精确指向 Mythos 找到的那一行代码,它也能找到同样的问题——但那根本不是 prompt、不是问题所在。"他用大海捞针比喻:"你找到了那根针所在的确切那一行,别的东西现在能捡起那根针——这不是一回事。"
  • 真实工作流的证据:"实际测试是我们去公司、去开源 repo。我们在 Firefox 发现了 271 个新漏洞,在不能披露的私有公司里发现了数千个——之前的模型没有人找到那 271 个。"
  • 对"廉价营销"的反击:"我们因为不发布这个非常强大的模型在商业上吃了巨亏。这个模型极大加速了 Anthropic 内部的研究和下一代模型;如果发布,它在外部世界也会这么做。这在商业上严重伤害了我们。"
  • 政府介入与多方拉扯:"我们一直在和政府谈,非常尊重他们的建议;他们因为担心反情报风险而放慢我们开放的节奏,我认为这是明智的。"现实张力是:"我有客户每天打电话要 Mythos,有国家打电话要 Mythos,又有美国政府和我的安全团队说'等一下,有风险'——我不是说哪一方对,真相在中间,但这是真实的挑战,我们需要作为社会一起面对,而不是指责对方廉价营销。"
"We found 271 new vulnerabilities in Firefox. 之前的模型没有人找到那 271 个。" —— Dario Amodei
17

政府会不会接管?长期受益信托与"对政府和公司的双向制衡"

核心要点:Dario 认同"政府为何允许私企控制如此强大技术"是严肃问题,但他的答案不是国有化,而是处处都要有制衡——包括一个能炒掉他自己的信托。

  • 历史的异常:"每一项强大技术——核武、互联网、GPS、手机——要么由政府建造,要么源于政府(R&D 在联邦实验室和大学)。AI 是第一项在私营部门建造、政府没有真正严肃角色、且姗姗来迟的技术。这是一个危险且不稳定的局面,不是我会选择的局面。"但他认为没有替代方案——"技术能被造出来,我们的对手在造,它有经济价值,它一定会被造出来;问题是政府没在做,而不是私营部门在做。"
  • 公司侧的制衡——长期受益信托(long-term benefit trust):"这是一个机构,能任命多数董事会成员、也能罢免多数董事会成员——本质上若一路穿透,它有权炒掉我。我们在引入一点点公共治理的元素,让你对一个不只是持有公司股票的人负责。无论公司发生什么,这个结构都会延续。我们也鼓励其他公司有类似结构。"
  • 政府侧的制衡:"国会有已宣布的努力来立法那些红线。我认为立法和司法分支需要发力,因为这项技术——我害怕公司拥有它,也害怕政府拥有它。公司需要制衡政府,政府需要制衡公司。"
  • 具体监管主张:"我们需要技术的基本监管,需要开始做发布前测试、强制的发布前测试,以及对模型的测试和审计。"
  • 他再次用"平滑指数"敲打两个极端:"硅谷有一群人,一开始连透明度、出口管制都觉得会'天启式地摧毁我们创造技术的潜力、扼杀创新';可一旦看到第一个真实危险,又全是'国有化、政府该直接没收'的论调。从最极端的反监管,横跳到完全共产式的'政府全拿走'——我们需要更明智、温和的路径,这正是我们一直偏好的,因为我们理解这项技术的力量,我们不恐慌也不否认。"
  • 与白宫的关系:"政府非常认真对待 Mythos,我们和财长 Bessent、幕僚长 Susie Wiles 都有很好的对话,他们真正理解风险的性质。任何一届政府都有相处得好的部分和更难相处的部分,这很正常,我们尽力周旋。"
"它本质上若一路穿透,有权炒掉我。无论公司发生什么,这个结构都会延续。" —— Dario Amodei(谈长期受益信托)
18

中国、百度经历与开源威胁:前沿的溢价压倒一切

核心要点:Dario 认为远离前沿的"落后模型"经济价值有限(智能有巨大溢价),但它们携带的 Mythos 级网络能力会成为真实的扩散风险;他对华的核心关切是地缘政治与高科技威权。

  • 前沿溢价论:"这项技术有一个对'模型多聪明'的真实溢价,我们极少看到人们偏好用更低智能的模型。"他承认存在繁荣的、对低端模型友好的生态,但"这是指数——远离前沿的模型可能有相当于 2023、2024 年的经济价值,但以 10x/年的增长,前沿上的东西总是远大于离前沿的东西"。
  • 对旧产品时代直觉的批评:"习惯于在上一个时代建产品的人不太理解这点。作为一个之前没运营过公司、从没想过上一个产品时代(尤其社交媒体时代)的人,我觉得自己是那个世界的局外人,而我觉得人们的直觉是错的——智能是如此巨大的因素,它压倒其他一切。"
  • 真实的扩散担忧:"我担心的是这些落后模型的风险——我们现在有 Mythos 级网络能力,12 个月后会有强得多的;但 Mythos 级的网络能力可能就变成任何人都能下载的了。希望那之前我们已经补好所有漏洞。我不认为我们能阻止它,但这是个严肃的担忧。"
  • 百度(Baidu)经历:"我在那儿工作了一年,大概更多学到的是语音识别。唯一让我担心的是,我们获得所有语音识别数据的部分方式是——他们不祥地说'我们在中国不在乎隐私,所以有这么多语音识别数据'。"
  • 真正的关切是地缘与人权:"最让我担心中国发生的事是维吾尔人遭遇的、对批评的压制——甚至在美国,香港发生的事,CCP 能伸进美国商业网络压制批评。这是一个威权国家、一个高科技威权国家;当我看到它与 AI 结合,你真的得到一个反乌托邦,1984 或更糟。"
  • 他的使命落点:"我的焦点是努力防止那个,我认为我们有机会防止。我认为我们有机会让 AI 成为一项亲民主的技术,让人们更自由、兑现'人人享有平等正义'的承诺;或者它走向另一边。走哪条路,取决于 AI 公司、政府和我们所有人的行动。"
"在中国不在乎隐私,所以我们有这么多语音识别数据——他们是这么不祥地说的。" —— Dario Amodei(回忆百度)
19

递归自我改进:没有"那个时刻",只有加速的指数

核心要点:Dario 拒绝"AI 自我改进的奇点时刻"叙事,代之以"连续加速的指数",并把它当作识别"谁不严肃"的试金石。

  • 他否认有一个时间点:"我不认为它是时间中的一个时刻,我认为它是一个连续过程。我们已经在某些方面看到 AI 能为下一代 AI 建议架构。"
  • 量化进展:"一年前我们看到 AI 带来的全要素生产率(TFP)增益大概 10-15%,现在可能到 20-30%,可能在翻倍。和所有事一样,我们在指数上。没有一个 AI 自我改进、失控或变得不安全的时刻;我们有的是一个加速的指数,在曲线的每一点,我们都得评估:是不是该减速了?是不是该对这项技术加更多控制了?我认为越来越多这样的控制会成为必需。"
  • 这条曲线是他的"罗塞塔石碑",也是他对两类人的"对象教训":反对一切 AI 监管、然后看到一件事就想国有化的人;以及轻视 AI 力量、然后突然'天哪它在自我改进、失控了、我们得全部关停'的人。"在这两种极端反应之间横跳极其无益。明智的回应是:我们不会恐慌,我们的反制措施会随技术的力量平滑地逐级提升。如果你看到某人有这种疯狂的横跳反应,那是他被打了个措手不及、不严肃的信号。"
"There's no moment where AI improves itself or runs out of control. 我们有的是一个加速的指数。" —— Dario Amodei
20

自比西拉德而非奥本海默:制衡哲学与 10-25% 的崩溃概率

核心要点:在全场收束处,Dario 用《原子弹的制造》给出他的领导哲学——不要"比生命更大"的中心人物,要处处制衡;并直面他自己给出的 10-25% 文明崩溃概率。

  • 最爱的书是《原子弹的制造》(The Making of the Atomic Bomb)。被问是否在自己和 Oppenheimer 之间看到相似,他给出一个反直觉的选择:"我最认同的人物是 Leo Szilard(利奥·西拉德),第一个基本提出可能存在链式反应的人。"
  • 他的领导哲学:"我们不会靠'比生命更大'的人格、或试图站在一切中心的人物闯过这关。这里需要权力的平衡——有很多有利益的强大行动者,唯一让所有人都有好结局的方式,是基本上处处都有制衡。所以在某些方面,我其实把 Oppenheimer 看作一个失败案例、看作不该发生的事。"
  • 直面崩溃概率:Emily 引他自己的说法——"大约 10-25% 的文明崩溃概率,这不是个小数字。有没有一种情景,是 Anthropic 造的东西导致了它?"Dario:"我当然希望不是。我的看法是我们采取的行动降低了那个概率而非抬高它。那个概率来自技术非常直接的配方、世界上存在许多国家、一个经济体里存在许多公司(若空缺没被填补还会有新公司产生)——这是我们身处的困境。我们在努力降低概率,我认为我们降低的远比抬高的多。"
  • 但他承认无法归零:"这项技术的固有属性是不可预测。我们尽量在发布前大量测试,今天发布的模型不危险,或至少在网络之外不真正危险,然后我们迭代、学习。公司里我们做的事有一半是尽力降低风险,但它永远不会是零。"
  • 收尾的航空公司比喻:你可以造一家比所有同行安全 10 倍的航空公司,但若有人问"你能保证飞机永不坠毁吗",你怎么可能保证?"但如果有 25% 的坠机概率,你不会上那架飞机。" Emily 接:"没错,25% 太高了。" Dario:"我们在努力把那个概率变得低得多得多,那就是目标。"
  • 对最后的"你在造极强的东西并将从中巨额获益,我们为什么该信任你",他的回答是把信任落到"行动史"上:"从不信任的位置出发是相当理性的——硅谷已失去世界很多信任、必须重新赢回。我们要传递的信息是我们真的不同,而这必须靠我们实际做的事来赢得:我们为价值观挺身(Mythos 严重拖累了我们的商业);更早还有一堆小事,比如在中国问题上我们身体力行——切断了模型访问,没人要求我们这么做,那在当时损失了几亿美元、而几亿是我们营收的相当大一部分;还有 Claude 2 的延迟……我们不完美、会犯错,但我请人们看整体历史,问'与这段整体历史最一致的假设是什么'。我认为一致的假设是:我们真心在努力做对的事。"
  • 纪录片在轻松一刻收尾:Emily 说"我们会在指数的另一边见到你",Dario 笑答"但愿如此"。被打趣"你总想当好莱坞明星",他自嘲 CEO 工作最意外的一件事是"要多频繁地化妆——这不在我的 bingo card 上"。
"我最认同的人物是 Leo Szilard……在某些方面,我把 Oppenheimer 看作一个失败案例、看作不该发生的事。" —— Dario Amodei
21

附录:关键人/机构/产品/数据

项目详情
Dario AmodeiAnthropic 联合创始人兼 CEO;前生物学家;曾在百度工作约一年;反战立场可追溯至 Caltech
Emily Chang本片采访者
Daniela AmodeiDario 的妹妹、Anthropic 联合创始人;Claude 曾诊断出她被名医漏诊的病
Holden KarnofskyDaniela 的丈夫;Open Philanthropy 主理人;2016 年三人同住 group house
Demis HassabisGoogle DeepMind,做 Gemini 与 AlphaFold;Dario 认识他 15 年,互换安全理念
Sam AltmanOpenAI CEO;印度峰会"拒绝牵手"事件另一主角
Jensen Huang(黄仁勋)批评 Dario"混淆 tasks 与 jobs"、暗指"末日营销"
Leo Szilard(西拉德)链式反应概念提出者;Dario 最认同的历史人物
Oppenheimer(奥本海默)Dario 视其为"失败案例/不该发生的事"
Bessent美国财政部长;与 Anthropic 就 Mythos 有良好对话
Susie Wiles白宫幕僚长;理解 Mythos 风险
AnthropicDario 的公司;成为营收与估值最高的 AI 公司
OpenAIDario 离开的公司;签下了他拒签的国防合同
Palantir自 2024 合作;其 Maven Smart System 涉伊朗 AI 辅助打击
Baidu(百度)Dario 工作约一年做语音识别;"中国不在乎隐私"数据来源
Claude Code / Claude co-work两个 hit 产品;co-work 发布引发"SaaS 末日"
Mythos最新最强模型,能自主走完网络 kill chain;"太强不敢发布"
Opus 4.7已发布的较弱网络模型,其防护可被越狱
长期受益信托可任免多数董事会成员,理论上能炒掉 Dario
《技术的青春期》Dario 著作,含 tasks vs jobs、六类应对方案
《原子弹的制造》Dario 最爱的书
$2850 亿Claude co-work 发布后一夜蒸发的市值("SaaS 末日")
近 1 万亿美元Anthropic 估值(Bloomberg 报道,高于 OpenAI)
10x/年Anthropic 规划的算力增长
季度 >3x ≈ 年化 80x2026 Q1 实测营收增速(远超计划)
半数入门级白领岗位Dario 称 AI 可能在 1-5 年内消灭(一年前论断)
1000 → 5000 个目标/天美军借 LLM 提升的日均打击目标数
271 个Mythos 在 Firefox 发现的新漏洞数
150+ 人伊朗女校空袭据报死亡人数(多为儿童)
TFP 10-15% → 20-30%AI 带来的全要素生产率增益(一年内变化)
10-25%Dario 自估的文明崩溃概率
token 税(token tax)Dario 提出的应对失业的政策构想