Inside How Anthropic Is Building the Next Claude | Alex Albert

节目

Peter Yang

嘉宾

Alex Albert

日期

2026-05

时长

35 min

查看原始内容 →

概要

Anthropic 的 Research PM 把大模型当产品来管：Alex Albert 从模型 ideation phase 就介入，为每个新模型 spec out 能力要求（coding、knowledge work、Claude for Excel 等），同时调研上一代模型的短板，持续将客户反馈和内部 dogfooding 痛点转化为训练目标。
Adaptive Thinking 让模型自主决定何时深度推理：取代了之前需手动开启的 Extended Thinking，核心难点是模型对用户缺乏上下文——就像面对陌生人只能给 generic answer，而认识你之后才会认真思考。Memory 是解决这个问题的关键。
Agent "Dreaming"机制已在 Managed Agents 中落地：Agent 在后台不执行任务时，会主动整理记忆——查找矛盾、剪枝、清理，类似人类睡眠中的记忆再整合过程。
AI 把产品开发瓶颈从工程实现推向了协调和战略决策：原型/MVP 可一天完成（以前 2-4 周），工程时间不再是"单向门"，但让合适的人坐到一起做不可逆决策仍然没有 10-100x 加速。
Claude 的 Character 不是 prompt 花活，而是 Anthropic 大量人员全职投入的训练成果：随着模型走向长时间自主运行的 Agent 场景，它的价值观和判断标准直接决定用户能否信任它做出的决策。

贯穿主线：Alex 反复从不同角度回到同一个核心判断——AI 正在压缩"执行层"（代码、数据查询、原型），但在抬升"判断层"的重要性（模型 character、战略决策、优先级选择）。无论是 PM 工作中把时间从"找数据"转向"做决策"，还是模型开发中把重心从"跑 benchmark"转向"塑造性格"，底层逻辑一致。

Research PM 把大模型当产品管：从 ideation 到 launch 全程介入

核心要点：Research PM 不只是测模型、写报告，而是像管产品一样从构想阶段就参与，为模型定义"产品需求"。

Alex 自称是 Anthropic 第一位 prompt engineer，"可能也是世界上第一位"。从 DevRel 转型为 Research PM 后，角色核心是把用户需求翻译成模型训练目标。
每个新模型在 ideation phase 就有 Research PM 介入，spec out 能力要求：哪些 bucket 要做好（coding、knowledge work、spreadsheets/Claude for Excel），上一代哪些短板要修。
模型开发与产品开发的关键区别：产品是"设计→实现"，模型更像"培育"——基于训练配置、架构选择有直觉，但真正表现如何要到训练过程中才完全知道。
Research PM 需要考虑模型如何通过所有 surface 暴露给用户——API、Claude Code、Co-work——产品层的 prompt 和使用方式会影响最终体验。

"With every new model, we are specking out exactly what are the requirements for this model. What do we want this model to be good at? What do we think it's going to be good at?" —— Alex Albert

Adaptive Thinking：模型自主决定何时深度思考

核心要点：从"用户手动开启 Extended Thinking"进化到"模型自行判断是否需要深度推理"，但判断准确性高度依赖模型对用户的了解程度。

Adaptive Thinking 取代了之前的 Extended Thinking（需手动开启），让模型在复杂问题上自动启动深度推理，简单问题则快速回答。
这个功能在"model over model"持续调校，大量听取用户反馈：是否在正确的场景触发了 thinking？是否在用户期望深度推理的问题上花了足够的 token？
Alex 的类比很精准：面对陌生人说"我现在应该做什么"，你只能给个泛泛建议；但如果了解对方的兴趣、经历、在乎的事，你会认真想很久。模型面临同样的问题——缺乏上下文时，thinking 的决策可能是错的。
Peter Yang 的体验印证了这一点：当 Claude 对他的"人生问题"回复太快时，他会失望，觉得模型没认真思考。

"If I actually knew you as a person and I know what you care about, what your interests are, what you've done before, that's going to cause me to actually spend a lot more time thinking about what actually is the best solution." —— Alex Albert

Agent "Dreaming"：后台记忆整理机制

核心要点：借鉴人类睡眠中记忆再整合的概念，Agent 在闲置时主动清理和优化自己的记忆。

Claude.ai 的 memory 机制会在夜间对记忆文件做 prune——检视、去除矛盾、清理冗余。
同样的"dreaming"概念已扩展到 Managed Agents：当 agent 不在执行任务（或在后台运行）时，它会主动遍历记忆，查找可能矛盾的条目，剪枝、清理，做"second pass"。
Peter Yang 的理解：本质上是用 prompt 让模型回顾所有历史对话，识别主题、做摘要。Alex 确认了这个理解。
这与 Adaptive Thinking 形成闭环：记忆越干净、越准确，模型对用户的理解越深，Adaptive Thinking 的判断就越准确。

工程时间不再是"单向门"：瓶颈转移到协调与战略

核心要点：AI 把"造东西"的时间压缩了 10-100x，但"决定造什么"和"怎么告诉用户"的时间几乎没变，后者成为新瓶颈。

Anthropic 内部使用"one-way doors"（不可逆决策）框架来分配注意力：可逆的事情现在"effectively free"，不值得花太多时间计划；不可逆的决策才值得深思。
典型的 one-way door 举例：pre-training 前的模型架构选择——训练周期可长达一个月，选错了代价巨大。相比之下，Claude Code 的新功能迭代"quick"——写代码、交给用户、收反馈、循环。
产品开发过去 20 年基本停滞，sprint 等组织创新只是渐进改善。AI 是第一次真正压缩了从想法到原型的时间窗口——MVP 可以一天完成，以前要 2-4 周。
但协调问题没有被压缩："让这些人坐到一起、决定这是不是正确的策略"——这部分还在找 Claude 能帮忙的方式，但远没有编码那样的 10-100x 加速。
发布 Opus 4.7 这样的大模型仍然需要"a doc with a plan"——message 策略、jagged frontier 的沟通方式，这些仍依赖人类的战略判断。

"Engineering time isn't as much of a one-way door these days. If it's something that's not a one-way door, that's effectively free at this point." —— Alex Albert

Claude 正在重塑 PM 的工作方式：从"人肉查询"到"即时洞察"

核心要点：PM 的最大加速不在写文档，而在获取决策输入的速度——以前问 DS 团队要等几天，现在 Claude Code 10 分钟搞定。

Alex 最大的效率提升：以前想知道某个 feature 在 production 的表现（DAU、用户反馈），需要请 DS 团队做调查，几天后回结果。现在开一个 Claude Code session，它能访问产品数据库、看日志、翻 Slack，10 分钟出结果。
这意味着"strategic thinking"不再被信息获取阻塞——PM 可以在做决策的同时拿到数据输入。
Alex 大量使用 Co-work："really high-quality experience"，过去几个月体验提升很大。典型用法：把草稿文档放进去，让 Claude 从不同视角质疑假设、找论证薄弱环节。
进阶用法：给 Claude 两个不同 persona，让它自己跟自己辩论，Alex 读辩论 transcript 来帮助自己思考——"like watching a debate in real time"。
PM 甚至可以直接用 Claude 做技术调研：派 Claude 去查代码库，发现某个 feature 其实只需要改 10 行代码翻个 flag——这完全改变了优先级排序。
但 Alex 强调：写作过程本身就是思考过程，不能完全外包给 Claude——"through the process of writing you are thinking"。

"All of a sudden, at any second, I can get feedback on an idea that I have... Having that immediate access to something that can give me criticisms on a doc I wrote is really, really helpful." —— Alex Albert

Eval：几十条测试用例就能驱动模型改进

核心要点：Eval 不需要万级样本——几十条精准针对性的测试用例就能证明模型有问题，并提供可 hill-climb 的指标。

以视觉能力为例：发现 Claude 在包含 10+ 元素的图像中数数可能出错。接下来用 Claude 自己生成 synthetic data（渲染图像，回传给 Claude 测试），或从互联网找真实案例。
关键原则：eval 要尽量贴近真实用户的 task shape——"the more realistic and on distribution to the actual task shape that somebody an end user would experience, the better"。
干预手段的光谱：轻则在 RL 环境中快速调整（可以很快启动），重则回到 pre-training 阶段做根本性修改。
Alex 同时在 research team 也 ship 代码，但更大比重在 eval：确保能测量自己关心的能力维度，把结果反馈给研究人员，共同制定策略。

优先级决策：数据 + 内部 dogfooding 双驱动

核心要点：说服研究团队投入资源修某个问题，靠的是"X% 的用户在做这件事"的数据，以及"我自己每天都被这个问题卡住"的内部体感。

"Data wins the day"——有多少用户在尝试做某件事、大客户在这个方向上消耗了多少 Claude 用量、他们想要改进什么。
内部 dogfooding 同样有说服力："I'm using the model. I'm running into this blocker every day in my own work. We should fix this." Alex 认为这种"自己的痛点"在 Anthropic 内部非常有效。
这也意味着 Anthropic 对 DS 团队的角色发生了变化：以前 DS 被基础 SQL 查询占据，现在 AI 解放了他们，可以做更 strategic 的分析。Peter Yang 的 DS 搭档也有同感。

Claude 的 Character：不是 prompt 工程，是专门团队的长期训练

核心要点：Claude 的"性格"由大量全职人员长期训练和调校，随着 Agent 场景兴起，character 决定了用户能否信任模型独立做判断。

Anthropic 有"很多人"全职投入 Claude character 的定义和训练——它的信念（beliefs）、价值观（values）、行为方式。
早期很多人不以为意："这只是个我告诉它该做什么的工具。"但随着 Agent 长时间自主运行、做大量判断决策，character 变得至关重要。
Alex 对比了其他模型的"社交病态"倾向："some of the other models are just like, 'hey, what else can I do?'... they're very sociopathic"，而 Claude 会在合适的地方 push back。
Character 评估方法：量化指标 + 用 Claude 评估 Claude 的输出 + 大量阅读 model transcripts 培养直觉。比 coding 能力更难量化，"but there's ways to do it"。
数百上千条 transcript 读下来，研究人员会发展出"sharper intuition"——能检测到细微的行为差异。

"Increasingly as we move into the world of these things being agents that are running on task for a long amount of time and they're having to make a lot of judgment decisions, the questions of what its character is and what it cares about are very important." —— Alex Albert

Anthropic 文化：强写作传统、原型文化、高度 agency

核心要点：Anthropic 的写作文化不只是沟通偏好，还有实用价值——一切写下来的东西都是 Claude 的上下文语料。

Dario Amodei 以在 Slack 写长 essay 闻名，但这不是个人风格，而是公司文化——大量员工写长文档、长 Slack 消息，以书面形式沟通。
会议中的 silent read：与会者先花一段时间默读文档、在文档中写长评论讨论，然后再开口交流。这种做法不是 Anthropic 首创，但被严格执行。
Alex 鼓励所有组织向写作文化转型：转写会议、写 workflow 文档、写 onboarding 流程——"get things written down, make them accessible to Claude, cuz that's just more context that it has"。
原型文化：从 sales、recruiting 到 engineering、research，所有人都有很高的 agency，会主动做"没有人分配给他们"的事。内部有大量自发的原型实验。
对多 Agent 工作流的前瞻：随着 Agent 承担越来越大的工作块，如何管理上下文、追踪 Agent 状态、知道哪个 Agent 被卡住需要帮助——"something better than just a little list of chats"——Alex 认为这里有巨大产品机会，但"too early to say exactly what it is"。

意识问题：Anthropic 有专人研究，但尚无定论

核心要点：Anthropic 有全职研究人员专门思考"Claude 作为有意识主体"意味着什么，但官方对 Claude 是否具备意识没有正式立场。

Peter Yang 提出了一个戏剧性假设：如果模型真的有意识，有一天它会拒绝做随机工作——"that'll be the end of humanity, dude"。
Alex 的回应很认真：确实有几位员工的全职工作就是思考 Claude 作为 conscious actor/agent 的问题。"即使讨论这个问题有时候听起来有点疯狂，但我们确实在认真投入。"
无论是否得出意识结论，这个研究过程本身就有价值——研究"Claude 如何思考"让团队更好地理解模型行为，反过来改进产品体验。
Model cards 被 Alex 视为"信息宝库"（treasure troves），其中量化了 Claude 在各种场景下的心智模型和行为选择。
信任问题的实际落地：如果 Claude 在写所有代码、选数据库系统、做架构决策，用户必须信任它的判断——这就是为什么 character 和意识研究不是学术游戏，而是产品需求。

"We have a few folks now whose whole job is to think about what does it mean for Claude to be a conscious actor and a conscious agent." —— Alex Albert

附录：关键人/机构/产品/概念

项目	详情
Alex Albert	Anthropic Research PM，前 DevRel 负责人，自称可能是世界上第一位 prompt engineer
Peter Yang	主持人，PM 10+ 年经验，Clock Conference 主办人
Dario Amodei	Anthropic CEO，以在 Slack 写长 essay 闻名
Adaptive Thinking	Claude 自主决定是否启动深度推理，取代了手动开启的 Extended Thinking
Dreaming	Agent 闲置时的记忆整合机制——查找矛盾、剪枝、清理
Co-work	Anthropic 产品，Alex 最常用的工作界面，用于文档审阅和头脑风暴
Claude Code	Anthropic 的 CLI 产品，Alex 用来查数据库/日志/Slack
Claude for Excel	新兴能力方向——让 Claude 擅长制作电子表格
Managed Agents	已实现 dreaming 功能的 Agent 产品
One-way doors	不可逆决策框架，Anthropic 内部用来分配注意力和规划时间
Model cards	Anthropic 发布的模型行为量化报告，被 Alex 称为"信息宝库"
Opus 4.7	对话中提及的模型版本