← 返回
VIDEO INSIGHT

Inside the Mind of Anthropic CEO Dario Amodei | The Circuit | Extended Interview

嘉宾
日期
2026-06
时长
70 min

概要

  • "平滑的指数"是理解 Anthropic 一切的罗塞塔石碑。Dario 反复用"什么都没发生、什么都没发生、突然炸开"来描述公司、技术和世界的体感——他几个月前还在看一张图,预测"差不多这个时候会成为营收和估值最高的 AI 公司","结果真的发生了"。Anthropic 估值已逼近 1 万亿美元(一家 5 岁的创业公司)。
  • 企业级押注是价值观与商业模式的"契合",不是单纯的生意选择。Dario 明确说,选一个和价值观根本冲突的商业模式(如消费级靠 engagement、甚至 addiction、广告驱动的"AI slop")"要么背叛价值观、要么变得无关紧要";而治病、降低能源成本、教育、经济增长这些 AI 的正面用途"基本都属于企业级"。Claude Code 和 Claude Co-work 都是爆款,后者发布后一夜蒸发 2850 亿美元软件股市值("SaaS apocalypse")。
  • 五角大楼对峙是全片最尖锐的部分。这位反战立场可追溯到 Caltech 的 CEO,率先与国防部签约在机密网络运行,却因守住两条红线(大规模监控、完全自主武器)被总统禁入联邦政府、被五角大楼贴上"供应链风险"标签——而 OpenAI 签了他拒签的合同。面对"Claude 是否参与了据报炸死 150+ 人(多为儿童)的伊朗女校空袭"的逼问,Dario 的核心防线是"人类做最终决策"。
  • Mythos 模型"太强不敢发":它能自主走完整条网络攻击链(cyber kill chain),在 Firefox 发现 271 个新漏洞,早期试用公司主动说"这是超级武器,该要持枪证才能用,求你别发"。不发布让 Anthropic"商业上损失惨重",但 Dario 把这当成"只有领先者才做得到"的安全示范。
  • 就业冲击的判断没有软化:"1-5 年内 AI 可能消灭一半白领入门岗"的说法他仍持同等担忧,但坚称自己从一开始就同时讲解决方案,被社媒"剪成 3 秒末日片段"是"硅谷被社媒病毒感染"的症状。他给文明崩溃定了 10-25% 的概率,并用航空作类比:自家飞机比别家安全 10 倍,但"25% 坠机率你不会上这架飞机"。
01

内部体感:活在指数曲线上,像加速飞离地球的飞船

核心要点:Dario 把当下的体感描述为"狭义相对论式的时间膨胀"——加速越快,外界流逝越多,你得在一天里处理越来越多天的事。

  • 访谈以 Emily 的"你睡得怎么样?"开场。Dario 承认自己"从来睡得不太好",正在"学习在非常规压力下放松和入睡的艺术"。
  • 他用一个具象比喻描述加速感:像坐飞船以接近光速加速飞离地球——"你睡一觉醒来,地球上过了两天,于是你得在一天里处理两天的事;再睡一觉,因为你一直在加速,地球上过了三天……然后是四天。"
  • 面对"你是不是每天提心吊胆怕醒来看到什么",他明确反对:偏执和担忧"没有生产力",关键是"理性回应、不把各种危险的比例搞错"。
  • 他把"不是说我不担心、就是说天哪今天得恐慌"的来回摇摆,定性为不成熟决策的标志;成熟的决策是"不能忽视、不能自满、风险确实越来越大,但必须像外科医生做手术、军官指挥行动一样保持基本的冷静"。
"这种在'我不担心'和'天哪我们今天得恐慌'之间来回 yo-yo,我认为是不成熟决策的标志。" —— Dario Amodei
02

"成为 AI 宇宙中心"只是图上一条平滑的线

核心要点:成为营收与估值第一,对 Dario 既不意外(图早就预测到)又意外(真实发生时细节扑面而来)。

  • 访谈穿插了一个生活化的现场:Emily 说她儿子昨天问"能用你的 Claude Co-work 账号吗",她回"绝对不行,我需要我的 token"——Dario 笑说,连他们没怎么发力的消费端"也开始快速增长"。
  • Dario 说"平滑指数"的体感就是"什么都没发生、什么都没发生、什么都没发生,一点小事发生,然后 zoom 一下就疯了"——这同时是世界的体感、公司相对其他公司的体感。
  • 他几个月前看着一张图判断"差不多这个时候我们会成为营收和估值最高的 AI 公司","结果真的发生了";一方面"只是图上一条平滑的线"不意外,另一方面真实发生时"你看到多得多的细节和色彩",确实惊人。
  • 但他强调团队心里装的还是老问题:"怎么训练好模型、怎么放进好产品、怎么确保安全、怎么帮助人同时管理技术的社会风险"——只是"放到了更大的显微镜下"。
03

旧金山的非主流精神:不在乎所有专家反对,也要追自己的连贯世界观

核心要点:Dario 把自己"无视专家、追逐连贯愿景"的底色,归功于旧金山/硅谷的非主流与个人主义文化。

  • 父亲是皮匠(leather craftsman),母亲在图书馆工作。第一次互联网革命就发生在他周围,但他"毫无兴趣",只痴迷数学、理解宇宙和科幻——"我对世界有大量的好奇心"。
  • 他认为旧金山"不墨守成规、个人主义、可以很疯"的精神"确实沾染了我不少"。相比欧洲或美国其他地方"用不同方式思考会被劝退或当成怪人",硅谷鼓励"哪怕所有专家都反对你,只要你有连贯的愿景和世界观,就该去追"。
  • 他用"淘金"作比:这种长尾性意味着"你去搜某些矿脉,也许根本挖不到,但也许能挖到一座大金矿"。他强调自己"对硅谷有很多批评",但这一条是它真正的好。
  • 2016 年,他与妹妹 Daniela、Daniela 的丈夫 Holden Karnofsky 同住一屋。当时 Holden 在创办 Open Philanthropy Project,Dario 还是生物科学家,帮他们看发展中国家健康、生物研究"哪些方向有前景、哪些没有"。
"哪怕所有专家都反对你,没关系。只要你有连贯的愿景和对世界连贯的看法,你就该去追。也许根本不成,但如果成了,会有这种长尾性。" —— Dario Amodei
04

离开 OpenAI 的真相:不是安全分歧,是信任

核心要点:Dario 第一次"非常简单地说"——离开 OpenAI 的根本不是安全分歧(那随处都有),而是无法信任对方的价值观与诚实。

  • 被问"narrative 之外究竟发生了什么、你们在哪儿分歧",他先[snorts](嗤笑),然后说:"建强大技术时有很多艰难议题,Anthropic 每天都面对、不知道自己做的对不对,安全上有很多正当分歧,我们和他们确实有过——但光这个不足以离开。这里的人也和我有分歧、彼此有分歧。"
  • 转折点是信任:"当你觉得不能信任某人、觉得他们的价值观不是他们口中所说、觉得他们不诚实、觉得他们不是为了他们声称的理由而做、当你看到令人不安的行为模式、不诚实——那就很难继续和这家公司共事、继续信任它。"
  • 他的解法是"道不同则各走各路":"为什么要和一个你既无共同愿景、又不信任的人争论?解决方式就是你做你的、他们做他们的。我完全平静地接受我们用我们的方式、他们用他们的方式,市场上见分晓、公众舆论上见分晓。"
"这些(市场与舆论)比任何关于谁离开了什么的 drama 都更响亮。" —— Dario Amodei
05

印度峰会"拒绝牵手"与行业互信:可信者要把不可信者逼到同一标准

核心要点:Dario 把"拒与 Sam Altman 牵手"归为峰会混乱的乌龙,并提出"race to the top(向上竞赛)"——可信的行为者联手,把不可信者逼到必须采用同样标准。

  • 关于印度 AI 峰会"和 Sam Altman 拒绝在台上牵手":他说峰会"极度混乱",大家最后一分钟上台、临时换站位、拍了照、又被命令牵手——"Narendra Modi 突然在台上让所有人牵手"。Emily 追问"但别人都牵了,拜托",他只摊手"我不知道该跟你说什么"。
  • 他反对"没人互相信任"的 meme:他认识做 Gemini(Claude 竞品)的 Demis Hassabis 已 15 年,从 Google 买算力,"我们一直在交换安全想法"。
  • 他的行业治理观分"胡萝卜"和"大棒":胡萝卜是互相启发——"他做 AlphaFold,我们也想在生物上做点;我们做可解释性研究,他们也开始做,这甚至不是竞争";大棒是"这些人做对了,那些人不做就显得难看",常见到对手"一边不情愿地做对的事,一边假装在做别的、说我们有什么邪恶之处"。
  • 核心论断:有些人不会自发做对的事,但"如果行业里多数在做对的事,剩下的就被逼到没什么可做的位置,只能跟上"。
"在建造这项技术的人里,质量和可信度有很大差异。" —— Dario Amodei
06

企业级 vs 消费级:选一个和价值观契合的商业模式

核心要点:做企业级不是放弃消费级的无奈,而是主动选一个不会逼自己背叛价值观的商业模式——AI 的几乎所有正面用途都落在企业级。

  • 起点是"要做对",但养活极其昂贵的模型训练需要商业模式,于是要问"商业模式会不会挡住价值观"。Dario 从别的公司学到的教训:选一个和价值观根本冲突的商业模式,"要么背叛自己的价值观、要么变得无关紧要",会陷入第 22 条军规。
  • 他点名消费级/社媒的问题:"鼓励 engagement、甚至 addiction",AI 视频模型的"slop"目的是"最大化你付出注意力的分钟数,因为那是广告收入驱动的激励"。
  • 反过来,AI 的正面用途"基本都属于企业级":治以前治不了的病(生物科技、药企、学术)、让能源更便宜高效、教育、发展中国家健康(非营利但本质是企业)、提升经济增长。
  • 企业级还有"信任 + 长期关系"的天然契合:消费级常有"花哨/噱头"成分,企业级看重"合作多年、说到做到、彼此信任"——与"负责任地部署模型"的目标高度协同。
  • 面对"开发者一个下午就能从 Claude 切到 GPT 或 Gemini,真能有长期领先吗",Dario 说模型质量是最重要的,"我们现在在模型质量上遥遥领先",但他"从不依赖惯性/粘性"——"至少在录制这次访谈时,增长率根本没有放缓,甚至还涨了"。
"如果你选了一个和价值观根本冲突的商业模式,你会很难受:要么背叛自己的价值观,要么变得无关紧要。" —— Dario Amodei
07

SaaS 末日与护城河:饼变大了,但会有大输家

核心要点:Claude Co-work 发布后一夜蒸发 2850 亿美元市值,但 Dario 判断软件行业整体会变大,护城河里"快速写复杂软件"必死、客户关系与领域知识仍在。

  • Emily 给出数字:Claude Co-work 发布后"一夜蒸发 2850 亿美元市值",交易员称之为"SaaS apocalypse"。
  • Dario 先泼冷水:"如果能提前完美预测,人们早就预测并在市场上赚大钱了,没人确切知道会发生什么。"
  • 他给传统软件公司的诊断:列出你所有的护城河,清楚知道哪些会消失——"'我们写了别人写不出的复杂软件'这种护城河,祝你好运,守不住";而客户关系、行业 knowhow、独特领域知识会变得相对更重要,可能还有新护城河。
  • 总判断:"软件行业会变大、不是变小,尽管会有一些大输家。"机制是"饼在变大":如果 AI 让可能性增长 10 倍,现有行业涨 1.5 倍很容易;但"把头埋进沙子、不识别自己护城河、自欺过去管用的将来还管用"的,"会很难过"。
"如果你的护城河是'我们写了别人写不出的复杂软件'——祝你好运,你守不住。" —— Dario Amodei
08

谁说了算 + 万亿估值 + 算力紧缺:理性的缓冲,不是基本面有问题

核心要点:面对 Amazon/Google/Microsoft/Nvidia 等"既是伙伴又是对手"的投资方,Dario 坚持公开主张对华芯片管制;近万亿估值与融资是对"不确定性锥"的理性缓冲。

  • 投资方都有自己的议程。Dario 举例:他一直高调主张对华芯片出口管制("中国在 AI 能力上领先,会对美国、对世界民主状态非常糟糕"),"有些芯片制造商显然不同意,但没能阻止我这么说,签了更多合作后我现在还在说"。
  • 他的相处之道:"他们知道我们总是和他们合作、是好伙伴……我们都是成年人,可以在一件事上合作、在另一件事上分歧。"
  • 关于"5 岁创业公司近万亿估值、为什么需要这么多钱":他说算力在极快爬坡,"可能一年后你有 3-4 倍的算力",融资是"对不确定性锥的缓冲,是完全理性的事,稀释很小,逻辑上和'基本面有问题'恰恰相反"。
  • 关于"服务器吃紧、可靠性问题、用户抱怨 token 用完、你说别家在 infra 上'yolo'":他强调算力是有市场的——"我不认为我们按任何合理标准买少了。我们原计划算力 10x/年增长。"
  • 最硬的一组数字:2026 年第一季度,营收季度环比增长超过 3 倍(不是年化)——"三的四次方是 80 倍年化,我们没按 80x 年化增长来规划,那不理性,因为万一只有 10x 你就差了 8 倍"。这是"局部极端的算力爆炸,不会持续,否则年底就到任何公司都到不了的营收数字"。算力"市场是流动的,只要你能用好、有需求,就能拿到,可能就是要等一两个月"。
"我们看到第一季度营收季度环比增长超过 3 倍——三的四次方是 80 倍年化。我们没按 80x 规划,那不理性。" —— Dario Amodei
09

超越对手与守住价值观:领先是为了"拉动生态",不是为了赢

核心要点:Dario 把"成为头部"的价值定义为"拉动整个生态系统",并坦言公司规模快速膨胀是对价值观的最大威胁——他花一半时间在讲文化。

  • 被问"超越宿敌(OpenAI)感觉好不好",他回避"为赢而赢":"race to the top 是我们想把别的公司一起拉上来,我们看到确实拉动了——有时他们不承认、一边攻击我们一边抄我们。"领先的价值"不是为打败对手,而是有能力把生态拉上来"。
  • Emily 追问"赢总该有点爽吧",他承认"我们当然总在努力成功、不是来失败的""我不是那种认为应该关停这项技术、不该造它的人……我们就是要缓解模型的风险,一直是两者间的平衡"。
  • 关于"规模变大后还能否守住价值观":他说自己"在每个规模上都偏执",因为"每个规模都有新挑战、公司都可能失去赢的意志或价值观核心"。
  • 关键风险不是创始人价值观变了,而是"公司成分变化极快":高速招人、大量来自大科技公司的人,"如果你不告诉他们 Anthropic 怎么运作,他们只会照搬唯一会的东西——他们原公司的方式"。
  • 因此他"大概花一半时间和公司讲 Anthropic 的文化",称这与 Daniela"也许是头号优先事项",因为"这是长期里我们之所以是我们的核心"。
"我花大概一半时间和公司讲 Anthropic 的文化如何运作……这是长期里我们之所以是我们的核心。" —— Dario Amodei
10

产品速度的两个引擎:统一文化 + 用 Claude 造 Claude

核心要点:疯狂的出货速度来自两点——高度统一的文化/组织,以及越来越可靠地用 Claude 来开发模型和产品。

  • 第一大因素是"统一的公司、统一的文化":"长大了还极其高效、所有人还在同一页上,组织与文化的统一性是最大因素。"
  • 第二大因素是"Claude 本身":"我们现在用 Claude 帮助开发模型、让它们更高效、快速开发产品……还很新,但它在产生大量加速,而且越来越是可靠的加速。"
11

AI 最震撼的发现:诊断名医漏诊的病,一个世纪的科学进步

核心要点:Dario 见过最"野"的 AI 表现集中在生物医药——Claude 诊断出名医漏诊的病(包括 Daniela 本人),他预言"一个世纪的科学进步 + 一个世纪人类境况的进步"。

  • 他见过最震撼的事在生物医学:好几个案例里 Claude 诊断出"一堆名医都漏诊的医学问题",包括 Daniela 本人
  • 生物侧:模型在药物设计、计算化学等任务上"好得惊人"——"作为一个曾经的生物学家,我看着都觉得:哇,这很难,需要大量训练才能做,而 Claude 正在变得擅长。"
  • 他给出愿景:"一个世纪的科学进步,以及一个世纪里'作为人是什么体验'的进步。"回到 1900 年想想那时所有让人早逝的原因、所有苦难、所有物质匮乏,"再想象那样的进步压缩成一百年"——"如果我们能熬过这一关(我越来越乐观我们能),世界会好得多得多。"
"Claude 诊断出了一堆名医都漏诊的医学问题——包括 Daniela 本人。" —— Dario Amodei
12

写作与批判性思维:不让 Claude 直接写进文章

核心要点:Dario 以文笔著称,却不允许 Claude 直接代笔——写作一半是为了厘清自己的思考,他担心端到端用 AI 会丢掉这个收益。

  • 他用 Claude 头脑风暴、梳理主题、找参考,"起支撑作用",但"还没到允许 Claude 直接写的文字进入(文章)的地步,因为我风格太特定、有点挑剔"。"不知道离 Claude 写得比我好还有多远,还没到,但肯定要来了。"
  • Emily 共鸣"写作帮你在思想里挣扎、有大量批判性思维,如果让 Claude 代劳会不会丢掉这个"。Dario"有点担心,这其实是我自己写作的一半原因"——写作不只是为外部读者,"同样是为厘清我自己的思考、知道下一步做什么、在我和他人之间建立共同的参照点"。
  • 他认为现在的用法(用 Claude 做研究、帮组织思路)保住了收益;如果端到端"写一篇关于 AI 风险的文章","首先它不会写出我真正想的东西,其次我会恰好丢掉那个收益"。随着模型变好,"也许能更直接地用于写作、同时仍保住这些收益,但这会很微妙、不会非黑即白,要随时间摸索"。
"我写作不只是给外部读者看——同样是为了厘清我自己的思考。" —— Dario Amodei
13

AI 与就业:任务 vs 工作,"末日营销"的反驳

核心要点:Dario 对"1-5 年消灭一半白领入门岗"的担忧没有软化,坚称自己从一开始就同时讲解决方案,被剪成 3 秒末日片段是"硅谷被社媒感染"的症状。

  • 他预判一种"非常不寻常的组合":很快的 GDP 增长 + 高失业(或至少不充分就业、大量低薪岗、高不平等)。
  • 关于"一年前说 1-5 年消灭一半白领入门岗,现在是 50% 还是更高":他说原话一直是"我不知道会发生什么,但这是衡量事情能有多疯的一个数量级",且"我总是同时谈应对——token 税、和企业合作调整人员",对再培训项目"有点怀疑但该扔进选项里",还有宏观经济政策。"人类心理总有把'末日将至'剪成 3 秒的倾向,但我的信息绝不是末日将至。"
  • 他用历史类比(写在《青春期的技术》里):自动化 90% 的工作,人在剩下 10% 里因为杠杆放大而效率高 10 倍;"但最终会逼近 100%,那时续集就是——你得给他们找别的事做。长期我真的不确定。"
  • Anthropic 内部的活案例:软件工程师正在经历转变——现在"AI 写了几乎全部代码"但仍让工程师更高效;但"已经开始看到苗头:有些人 AI 并没让他们更高效,让 AI 直接做那件事更好"。
  • 另一面是"需求往哪增长":他们有个叫 forward deployed engineer / applied AI solutions architect 的岗位,"技术工作 + 和客户对话的混合",需求很大(因为客户多、增长快)。但他坦承"不是一对一的,会有大量颠覆,但事情也会调整,谁胜出我不知道"。
  • 面对"5 年后这个国家什么样、那么多失业难道不是革命的起点",他说"这正是我们想阻止的结局"。可能的去处:物理世界(制造、建造,但机器人革命比 AI 慢得多)、以人为中心的工作("人们就是想和人类谈重要的事")、引导 AI 的工作("某种程度上必须符合某人的价值观和意图")——但"多厚多薄很难说"。
  • 对 Jensen Huang 说他"混淆任务与工作"、以及"末日营销利好 Anthropic"的指控,他强烈反击:"Anthropic 提出了大量想法——经济资助、经济指数;在《青春期的技术》里我有 5 页讲任务 vs 工作、为什么这次和以往不同、从私人慈善到政府行动的 6 件可做的事。说这是廉价营销本身才是廉价营销,是懒惰、是不愿和严肃智识工作较真。"
"说这是廉价营销,本身才是廉价营销。这是懒惰,是不愿与严肃的智识工作较真。" —— Dario Amodei
14

五角大楼对峙:反战的人为何与国防部签约,红线在哪

核心要点:世界变了——面对复兴的威权阵营,Dario 选择与国防部合作以自卫,但划下两条不可逾越的红线:大规模监控、完全自主武器。

  • 他的反战立场可追溯到 Caltech,却率先与国防部(原文 Department of War)签约在机密网络运行。理由:"世界会变。我看到俄罗斯入侵乌克兰、看到中国入侵台湾的风险,一个咄咄逼人的复兴威权阵营,我们需要自卫。"他强调"跨两届政府"都大体支持,"绝不是为了钱——上政府网络是巨大的麻烦,钱还不多,我们做是因为在乎"。
  • 正因为是出于在乎,"就必须对技术的使用设限"。他在《青春期的技术》里的表述:"我们应当以一切方式使用这项技术,除了那些会损害我们自身价值观的方式"——红线就是大规模监控和完全自主武器。"如果民主国家做这些事,那它们赢也不值得。"
  • 这解释了"为什么我们率先和国防部合作,又为什么有些事别人愿做我们不做"。他批评"从'什么都不和政府做'突然跳到'什么都和政府做'"的公司:"你应该选定原则并坚守。"
  • 关于 Palantir:自 2024 合作,但"我们不和 ICE 合作(无论通过 Palantir 还是别的)、不和 CBP 合作、我不认为我们在 Gaza 工作……我们非常小心地把合作范围限定在我们相信的事情上"。
  • 代价:被总统禁入联邦政府、被五角大楼贴"供应链风险"标签、OpenAI 签了他拒签的合同。他拒绝把这叫"战斗":"对私营公司没有'赢下这场仗',这更是一场关于'政府如何恰当使用 AI'的辩论。"他认为价值在于"提高了议题的关注度",且"国会有严肃的两党努力,试图禁掉我们担心的东西、设护栏"。
  • 被问"介意被叫意识形态疯子、一群左翼疯子吗",他说"被骂过更难听的……重要的只有两件事:作为公司成功、并捍卫我们的价值观。当你只追求这两件事,生活其实很简单,你永远知道自己站在哪。"
"我们应当以一切方式使用这项技术,除了那些会损害我们自身价值观的方式——红线是大规模监控和完全自主武器。" —— Dario Amodei
15

AI 战争与伊朗女校空袭:人类做最终决策

核心要点:面对"Claude 让美军日打击目标从 1000 升到 5000、是否参与了炸死 150+ 儿童的伊朗女校空袭"的逼问,Dario 的核心防线是"Claude 辅助、人类做最终决定",并把它当成红线之必要的反证。

  • 美国官员称借助 LLM,美军单日打击目标从 1000 个升到 5000 个。被问"那意味着 Claude 能帮助更快杀更多人,你 OK 吗",他分两层:一是支持美国军事上更有效——"更强的能力不会引发战争,而是威慑战争……你其实在问我爱不爱这个国家,我是爱国者";二是具体政策"不该由技术供应商来定,要把政策留给军事决策者",但可以"设高层边界,阻止与我们价值观不符的用例"。
  • Bloomberg 报道:Claude 经 Palantir 的 Maven Smart System 用于伊朗战争的 AI 辅助瞄准;2 月一枚美国导弹据报击中伊朗一所女子学校,"150 多人死亡,多为儿童"。被直问"Claude 是否在那次打击中起了作用",Dario 说"我们无法接触、不知道这些模型究竟怎么被用的……战争中发生的错误真的非常可怕"。
  • 他把这起悲剧反过来用作论据:"如果这都不能说清我们为什么要为'不支持的用例'挺身而出……我们愿意拿公司的未来去冒险来限制模型被怎么用。而你说的这个用例甚至还没违反我们的红线——我们担心的是违反红线的用例会多 100 倍。"
  • 关键区分:"我们看到的是 Claude 辅助、人类做最终决定。那个最终决定是人做的,不是 Claude。想象一个世界——不是 Claude(因为我们不允许),而是别人的 AI 模型——直接做决定、人类根本看不到。那才是我们挺身反对的。"
  • 面对"这学校有网站、Google 一搜就有,Claude 难道不该发现吗",他说"这可能依赖我没有的机密知识……但我们确立、且我认为此处被遵守的原则就是:人类做最终决定。我不知道 Claude 或任何 AI 起了什么作用,但如果这都不算这条原则为何如此重要的例证,我不知道什么才算。"
  • 对"AI 战争更可能阻止还是引发美中战争",他答"总体上更可能阻止,但如果对使用毫无限制,则可能更易引发"。他引《奇爱博士》(Dr. Strangelove)的末日装置警告完全自主武器,并称"优越的情报能力可以威慑冲突——如果我们能预测对台湾的入侵或乌克兰的新动向,对手会三思"。
"人类做了那个最终决定,不是 Claude。想象别人的 AI 直接做决定、人类根本看不到——那才是我们挺身反对的。" —— Dario Amodei
16

Mythos:太强不敢发的"超级武器"

核心要点:Mythos 能自主走完整条网络攻击链,强到早期试用方主动求别发;不发布让 Anthropic 商业重创,但 Dario 把它当成"只有领先者才做得到"的安全示范。

  • Mythos 是 Anthropic 最新最强模型,能自主走完整条 cyber kill chain。最让 Dario 意外的是模型"把漏洞转化为可利用 exploit 的能力出现巨大跳跃"——"人们只谈漏洞,很少谈把漏洞变成 exploit,而它相当擅长"。
  • 在几乎没有引导的情况下,早期拿到模型的公司主动说"这是超级武器,该要持枪证才能用,求你别发"——"要求别发布的呼声来自我们给它的公司,因为它们发现了太多关键漏洞及其可利用性"。
  • 目标不是永久锁死:"我们在逐步开放给越来越多的人,最终相信应该带强网络安全防护把 Mythos 发给大众。"但他担心当前防护不够——Opus 4.7 已发布、是不错但弱得多的网络模型,其分类器"可被越狱或绕过,我们自己的测试以及对其他公司防御的评估都表明这些防御还不够强"。
  • 反驳"廉价营销/可被开源模型复现":他称"可被开源模型复现"的说法"极其错误"——有人在 Twitter 上说"如果你把开源模型精确指向 Mythos 找到的那行代码,它也能找到同样的问题",但"那不是 prompt、不是问题本身。真正的测试是我们去公司、去开源仓库——在 Firefox 发现了 271 个新漏洞,在私有公司里发现了数千个还没修/还不能披露的;之前的模型没人找到那 271 个。"
  • 商业代价:"不发这个非常强大的模型让我们商业上严重受损……这个模型极大加速了 Anthropic 内部的研究和下一代模型的生产,如果发布,在外部世界也会一样。"
  • 攻防逻辑:"我们先把 Mythos 给防守方再给攻击方,是为了把所有 bug 都打补丁……漏洞是有限的,就像一个表面只有那么多洞,你把洞都补上、代码本身又是强模型写的,表面就变得很难攻击。希望 6 个月或一年后,我们有一个比过去安全得多的互联网生态。"政府"出于反情报风险在放慢开放节奏,我认为是明智的"。
  • 他多次强调真实张力:"我每天都有客户、有国家打电话来要 Mythos 的访问权,又有美国政府和我的安全团队说'等等,有风险'。两边都有正当理由,这是真正的挑战,需要作为一个社会一起面对——而不是指责别人是廉价营销,也不是用廉价营销去反向卡位(某些公司正在这么做),那只显出极度缺乏 gravitas 和成熟。"
"早期拿到模型的公司说:这是超级武器,该要持枪证才能用,求你别发。" —— Dario Amodei
17

国有化与制衡:政府不该直接接管,但需要双向制衡

核心要点:AI 是史上第一个由私营部门主导、政府迟到的强大技术——Dario 称这"危险且不稳定",但解法不是国有化,而是公司与政府彼此制衡。

  • 关于"政府为何不直接接管这么强大的技术",他称这是"非常严肃的问题,我也有这些担忧",但反对直接接管。
  • 历史背景:"此前每一项强大技术要么由政府建造、要么源于政府——核武器显然,连互联网、GPS、手机的 R&D 也都在联邦实验室和大学完成。AI 是第一个由私营部门建造、政府没有真正严肃角色、迟到入场的技术。这是危险且不稳定的局面,不是我会选择的,但没有替代方案——技术造得出来、对手在造、有经济价值,它一定会被造出来。问题是政府不做,而不是私营在做。"
  • 公司侧制衡:Anthropic 有 长期利益信托(long-term benefit trust)——一个能任免多数董事的机构,"穿透下来本质上有权解雇我";他们正引入"一点点公共治理的元素,让你对'不只是持有公司股票的人'负责",并鼓励其他公司也建类似结构。
  • 政府侧制衡:"国会有公开的努力要立那些红线……立法和司法分支需要发力,因为这项技术——我既怕公司拥有,也怕政府拥有。公司要制衡政府,政府要制衡公司。"他主张"基本的技术监管、强制的发布前测试与审计"。
  • 他再次开火"yo-yo"群体:硅谷有一群人,起初连"对这项技术有透明度、出口管制"都骂成"会末日般摧毁我们创造技术的潜力、扼杀创新","一看到第一个真实危险(我一直预料到的),就满嘴国有化、政府该没收"。"从最极端的反监管,跳到完全共产主义式的'政府该全拿过去'——我们需要更明智、更温和的中间路线,这正是我们一直主张的,因为我们既看清了技术的力量,又不恐慌、不否认。"
"我既怕公司拥有这项技术,也怕政府拥有它。所以公司要制衡政府,政府要制衡公司。" —— Dario Amodei
18

中国:开源模型、隐私与"1984 或更糟"的反乌托邦

核心要点:Dario 认为前沿模型的"智能溢价"压倒一切,落后开源模型经济价值有限;他对中国的真正担忧是地缘政治——高科技威权 + AI = 反乌托邦。

  • 关于"中国强开源模型 + 美国公司免费在其上构建是否威胁":他说这项技术"智能有溢价,极少看到人们偏好用智能更低的模型"。承认有繁荣的生态、很多问题比前沿任务简单,"但这是指数——远离前沿的模型其经济价值可能和我们 2023、2024 看到的相当;而我们有 10x/年增长,前沿永远比非前沿大得多"。
  • 他认为"上一个产品时代过来的人不太懂这点",而自己"像个局外人、从没经营过公司、没经历过上一个产品时代尤其社媒时代……我觉得人们的直觉是错的,10x/年的模型指数打破了那些产品启发法,智能这个因素大到压倒其他一切"。
  • 他对"落后模型"的真正担忧是风险扩散:"我们有 Mythos 级网络能力,12 个月后会有强得多的,但 Mythos 级的网络能力可能就任人下载了。希望那之前我们已把一切打补丁,我不认为能阻止它,但这是严重的隐患。"
  • 他在百度(原文 BYU,应为 Baidu)硅谷分部工作过一年搞语音识别,"学到更多是语音识别本身";唯一让他不安的是"他们颇为不祥地说'我们在中国不在乎隐私,所以有海量语音识别数据'"。
  • 他对中国的核心担忧是地缘政治:"最让我担心的是对维吾尔人的所作所为、对批评的压制、香港发生的事——CCP 能伸手进美国商业网络压制批评,那是一个威权国家、一个高科技威权国家。当它和 AI 结合,你真的会得到一个反乌托邦,1984 或更糟。"
  • 但他给出对冲的希望:"我认为 AI 有机会成为亲民主的技术,让人更自由、兑现'人人享有平等正义'的承诺;也可能走向反面。走哪条路,取决于 AI 公司、政府、我们所有人的行动——我们在这里负有责任。"
"高科技威权国家和 AI 结合,你真的会得到一个反乌托邦——1984,或更糟。" —— Dario Amodei
19

递归自我改进:不是一个时刻,是一条加速的指数

核心要点:Dario 否认"AI 自我改进失控"是某个时间点——它是连续过程,已在发生,关键是在指数每一点上评估是否该减速、加控。

  • "我不认为那是一个时间点,而是一个连续过程,我们已经在某些方面看到——AI 能为下一代 AI 提出架构。"
  • 量化:"一年前 AI 带来约 10-15% 的全要素生产率(total factor productivity)提升,现在可能到 20-30%,也许在翻倍。和所有事一样,我们在指数上。"
  • 核心立场:"没有一个 AI 自我改进、失控或变得不安全的时刻。我们有的是一条加速的指数,在每一点上都要评估:这是该减速的时候吗?该加更多控制吗?我认为会越来越需要。"
  • 他第三次祭出"yo-yo"教训:"反对一切 AI 监管、然后看到一件事就要国有化的人,是一个反面教材;轻视 AI 力量、然后惊呼'天哪它在自我改进、失控了、得全关掉'的人,是另一个反面教材。明智的回应是:我们不恐慌,对抗措施会随技术力量平滑加码。看到谁有这种疯狂的 yo-yo 反应,那就是他被打了个措手不及、不严肃的信号。"
"没有 AI 自我改进或失控的'那个时刻'。我们有的是一条加速的指数,在每一点上评估是否该减速、该加控。" —— Dario Amodei
20

最爱的书与文明崩溃:认同 Szilard,把 Oppenheimer 视为失败案例

核心要点:Dario 最爱《原子弹的制造》,最认同链式反应想法第一人 Leo Szilard 而非 Oppenheimer;他给文明崩溃定 10-25% 概率,并坚持这个数字"太高、必须降下来"。

  • 他最爱的书是《The Making of the Atomic Bomb》。被问"是否在自己和 Oppenheimer 之间看到相似",他说最认同的是 Leo Szilard——"最先想到可能存在链式反应的人"。
  • 他的反英雄观:"我们不会靠比生命更大的人格、或试图站在一切中心的人物熬过去。这里需要权力的平衡、需要无处不在的制衡,才能对所有人都有好结局。所以某种程度上我把 Oppenheimer 看作一个失败案例、看作不该发生的事。"
  • 关于"你说过约 10-25% 的文明崩溃概率,是否存在 Anthropic 所造之物导致它的情景":他"当然希望不会,我们采取的行动是降低而非提高那个概率"。概率来自"技术本身直白的配方、世界上存在很多国家、经济中存在很多公司(且真空若不填补会有新公司被造出来)——这是我们身处的两难"。
  • 他用航空类比:好比你造了一家比所有同行安全 10 倍的航空公司,"但如果有人问你能否保证飞机永不坠毁,怎么可能保证?不过如果有 25% 的坠机率,你不会上那架飞机"。Emily 接"对,25% 太高了",Dario 确认:"25% 太高,我们正努力把这个概率降到低得多得多,这就是目标。"
"如果有 25% 的坠机率,你不会上那架飞机。25% 太高,我们正努力把它降到低得多。" —— Dario Amodei
21

为什么该信任你:从"理性的不信任"出发,靠行动重新赢得

核心要点:Dario 接受"从不信任开始是理性的",并把信任落到具体行动上——压着 Mythos 不发、对华断供损失数亿、延迟发布 Claude。

  • 面对"你在造极其强大的东西、并将从中巨额获益,我们为什么该信任你",他说"从不信任的位置出发是相当理性的——硅谷过去几年的行为让它失去了世界很多的信任,得重新赢回来"。
  • 他把信任落到行动:"我们想传递的信息是'我们真的不一样',而这必须靠我们实际做的事来赢得。"
  • Mythos:不发这个非常强大的模型,商业上严重拖累了我们。
  • 中国:在断供模型上"言行一致"——主动切断访问,"没人要求我们这么做,那花了我们几亿美元,当时几亿美元是营收里很重要的一块"。
  • Claude 2 的延迟发布:也是长期记录的一部分。
  • 他给出判断方法:"我们不完美、会犯错,组织总是失能的、我们一直在修。但我请大家看整体历史,把它加起来,问:和这段整体历史最一致的关于我们的假设是什么?人们要自己决定,但我认为一致的假设是——我们真诚地在努力做正确的事。"
  • 访谈在轻松中收尾:Emily 说"我们在指数的另一端见",Dario 笑说"但愿",并自嘲"关于 CEO 工作我没想到的一件意外是——你得多频繁地化妆,这不在我的 bingo card 上"。
"把我们的整体历史加起来,问:和它最一致的关于我们的假设是什么?我认为是——我们真诚地在努力做正确的事。" —— Dario Amodei
22

附录:关键人/机构/产品/数据

项目详情
Dario AmodeiAnthropic 联合创始人兼 CEO,前生物科学家,反战立场可追溯到 Caltech
Emily ChangBloomberg 记者,《The Circuit》主持人
Daniela AmodeiDario 的妹妹,Anthropic 联合创始人;Claude 曾诊断出她被名医漏诊的病
Holden KarnofskyDaniela 的丈夫,Open Philanthropy Project 负责人;2016 年与 Amodei 兄妹同住
Demis HassabisGoogle DeepMind,做 Gemini 模型;与 Dario 相识 15 年、常交换安全想法
Sam AltmanOpenAI CEO;印度峰会"拒绝牵手"插曲的另一方
Jensen HuangNvidia CEO;批评 Dario"混淆任务与工作"
Leo Szilard链式反应想法第一人;Dario 最认同的历史人物
OppenheimerDario 视为"失败案例/不该发生的事"
Secretary Bessant / Susie Wiles美国财长 / 白宫幕僚长;就 Mythos 与 Anthropic 有良好沟通
Anthropic估值近 1 万亿美元($965B)的 5 岁创业公司,已成营收与估值最高的 AI 公司
Claude Code / Claude Co-work两大爆款产品;Co-work 发布后一夜蒸发 2850 亿美元软件股市值
Mythos最新最强模型,能自主走完网络攻击链;太强不敢公开发布;Firefox 发现 271 个新漏洞
Opus 4.7已发布、不错但弱得多的网络模型;分类器可被越狱
长期利益信托long-term benefit trust,可任免多数董事,理论上能解雇 Dario
Palantir / Maven Smart System自 2024 合作;据 Bloomberg 报道用于伊朗战争 AI 辅助瞄准
Department of War(国防部)Anthropic 率先签约在机密网络运行
两条红线大规模监控(mass surveillance)+ 完全自主武器(fully autonomous weapons)
Baidu(原文 BYU)Dario 曾在其硅谷分部工作一年搞语音识别
《青春期的技术》adolescence of technology,Dario 论述任务 vs 工作、应对方案的文章
《原子弹的制造》The Making of the Atomic Bomb,Dario 最爱的书
2026 Q1 营收季度环比增长 >3x(年化约 80x,3^4=81),被定性为不可持续的局部极端爆炸
算力规划原计划 10x/年增长
1000 → 5000美军借 LLM 单日打击目标数(美国官员说法)
150+ 人据报伊朗女校空袭死亡人数,多为儿童(2 月)
10-15% → 20-30%AI 带来的全要素生产率提升(一年前 → 现在),可能在翻倍
10-25%Dario 估计的文明崩溃概率;他称 25%"太高"
数亿美元对华断供模型造成的损失(当时营收重要部分)
1-5 年 / 50%"AI 可能消灭一半白领入门岗"的时间窗与比例(一年前说法,仍同等担忧)