← 返回
86 min 2025-12

How Anthropic's product team moves faster than anyone else | Cat Wu (Head of Product, Claude Code)

概要

Anthropic产品负责人Cat Wu分享团队如何将发布周期从6个月压缩到1天,PM/工程/设计角色融合趋势,以及Claude Code产品矩阵的演进方向

AI 时代 PM 必须以天为单位迭代,6 个月路线图已死

核心要点:PM 的核心能力已从"协调多季度路线图"转变为"缩短想法到用户手中的时间";Anthropic 的产品发布周期从 6 个月压缩到 1 天,团队中的任何工程师都被赋权在一周甚至一天内将想法变为上线产品。

  • Cat Wu 面试了数百位 PM 候选人,发现大多数人仍然用传统方式思考 PM 角色——强调多季度路线图对齐、跨团队协调。她认为这在 AI 时代已完全过时:"AI 之前,技术变化慢,你可以在 6-12 个月的时间线上规划。现在模型能力每隔几个月就有大幅跃升,产品周期必须同步加速。"
  • Anthropic 的发布节奏已经到了"有人做了一张日历,发现几乎每天都有重大功能或产品上线"的程度。Lenny 评价这是他见过的最快发布速度。
  • 当被问到是否因为内部使用了 Mythos 模型才能如此快速时,Cat Wu 坦承 Mythos 确实强大,"但这不能解释大部分加速"。核心是流程和团队期望:低流程、消除一切发布障碍、赋权每个人独立交付。
  • PM 仍然需要做的关键工作:设定清晰目标("我们的核心用户是专业开发者,要解决的问题是权限弹窗疲劳")、定义关键用例、设立可重复的发布流程。PRD 不是每个功能都需要,但对于特别模糊或需要重度基础设施的项目仍然有价值。
  • 团队每周做全员指标通报(metrics readout),确保每个人都深刻理解业务的所有维度——目标、趋势、驱动因素。配合团队原则文档(核心用户是谁、为什么、愿意做什么 trade-off),让所有人能自主决策而不被 PM 或其他利益相关方 block。
"The timelines for a lot of our product features have gone down from 6 months to one month and sometimes to one week or even one day." —— Cat Wu

Anthropic 极速发布的三个组织秘密

核心要点:Anthropic 的发布速度不是靠加班或英雄主义,而是靠三个结构性机制:research preview 降低发布承诺、工程师端到端独立交付、跨职能流程实现次日公告。

  • Research Preview 机制:几乎所有新功能先以 research preview 上线,明确告知用户"这是早期产品、只是一个想法、可能不会永久支持"。这大幅降低了发布的心理门槛和组织承诺——一两周内就能推出新功能获取反馈。
  • 工程师端到端交付:团队中许多工程师可以完全独立地从"在 Twitter 上看到用户反馈"到"周末前上线解决方案",几乎不需要产品介入。Cat Wu 认为这是最高效的交付模式。最近上线的 /powerup 功能就是一个例子——团队最初坚持"产品应该直觉到不需要教程",但最终承认功能太多(超过 100 个),用户需要一个内置引导来了解"最重要的 10 个功能是什么"。
  • 跨职能次日公告流程:工程师觉得功能就绪并在内部 dogfood 后,发到 evergreen launch room;文档负责人 Sarah、PMM 负责人 Alex、DevRel 的 Tar 和 Lydia 立即跟进,次日即可发出公告。PM 的角色是搭建这个流程框架,而不是每次都亲自协调。
  • 这种速度的代价是产品一致性。Cat Wu 坦承,由于功能发布太快、有时不同功能之间存在重叠("因为内部有两种我们都喜欢的形态,想让外部用户告诉我们哪个更好"),新用户可能不知道完成某个任务的最佳路径。用户也会感到需要每天刷 Twitter 才能跟上最新动态。
"We want to remove every single barrier to shipping things. We want to make sure every single person on the team feels empowered to take their idea from just an idea to out in the world in less than a week, sometimes even in a day." —— Cat Wu

PM/工程师/设计师角色融合,产品品味成唯一硬门槛

核心要点:三种角色的边界正在模糊化——PM 写代码、工程师做 PM 工作、设计师落地代码。Cat Wu 认为所有这些角色最终都收敛到同一个核心能力:"决定写什么",即产品品味。

  • "代码变得极其廉价之后,更有价值的是决定写什么——什么是正确的 UX?什么是最令人愉悦的体验?我们收到数万个 GitHub issue 请求各种功能,需要大量品味来判断哪些值得做、怎样做才对。"
  • Claude Code 团队几乎所有 PM 都有工程背景或在团队里写过代码;设计师也都曾是前端工程师。Cat Wu 自己在加入 Anthropic 前做了多年工程师,短暂做过 VC。
  • 工程背景目前特别有价值的原因:能判断"某件事应该有多难",从而影响优先级决策——如果一个功能很简单,与其讨论不如花一小时直接做;如果很复杂,提前知道成本有助于取舍。但 Cat Wu 特别指出这个优势"可能只持续几个月",因为模型编程能力每隔几个月就有大幅跃升,会改变什么技能更有价值。
  • 当被问到角色融合的代价时,Cat Wu 坦诚回答:牺牲了产品一致性。传统模式下会仔细规划整个产品套件中每个产品的关系、用例和集成方式;现在速度优先,有时功能之间会重叠。
  • Cat Wu 提到了 Amole(另一位最近上 Lenny 播客的嘉宾)的观点:因为工程师产出太快,PM 和设计师反而被挤压——跟不上每天都在上线的功能。他因此认为需要更多 PM。Cat Wu 的回应是:与其分别增加 PM 和工程师,不如招有强产品品味的工程师,减少交付开销。
"As code becomes much cheaper to write, the thing that becomes more valuable is deciding what to write." —— Cat Wu

Claude Code / Desktop / Co-work 三产品矩阵

核心要点:产出是代码就用 Claude Code 或 Desktop,产出不是代码就用 Co-work。三者形成互补矩阵,覆盖从终端到移动端、从编码到非编码的全部工作场景。

  • Claude Code(CLI):最强大的产品面,新功能最先落地。适合一次性编码任务或同时处理少量任务。Cat Wu 自己在"只是想启动一个或几个编码任务"时首选 CLI。
  • Desktop:两大优势——①前端开发体验:内置 preview 面板,可以实时看到正在构建的 web 应用;②对非技术用户更友好,终端的弹窗和命令行界面对非技术人员"很吓人"。Desktop 同时是一个控制面板,可以看到 CLI 会话、Desktop 会话、Web/Mobile 会话的全貌。
  • 移动端(Web/Mobile):解决"出门在外无法访问笔记本电脑"的问题。Cat Wu 提到她见过无数人在户外时"抱着笔记本电脑、手机热点连接"的窘况——因为 agent 正在工作不能断。移动端让用户可以随时随地启动任务。Lenny 补充了一个场景:飞机上的人"必须让 agent 完成工作,需要 Wi-Fi"。
  • Co-work:定位于"产出不是代码"的所有工作——Slack 回复管理、制作演示文稿、撰写文档、拟定发布计划。Cat Wu 的心智模型很清晰:输出是代码→Claude Code/Desktop/Mobile;输出不是代码→Co-work。

Co-work 深度案例:从 20 页幻灯片到每日客户简报

核心要点:Co-work 的真正威力在于连接数据源(Slack、Gmail、Google Drive、Google Calendar)后的深度上下文理解——它不只是一个聊天机器人,而是一个能主动在组织知识库中搜索、综合、生成产出的 agent。

  • 20 页幻灯片一夜生成的故事:Cat Wu 需要为即将到来的 Code with Cloud 大会准备一场演讲,讲述 Claude Code 从助手到全面 agent 的演变。她的 PMM Alex 已经起草了初步要点。Cat Wu 把 Alex 的草稿、自己不满意的手动版本、以及"不要和更重要的 keynote 重叠"等约束一起喂给 Co-work,让它先生成带细节的大纲提案。Co-work 花了一个小时——翻 Twitter 查发布历史、翻 evergreen launch room、翻 Cloud Code announce 频道(团队分享 Claude Code 使用心得的内部频道),综合出一份 20 页的幻灯片。Cat Wu 第二天早上醒来看到初稿"还挺好的",只需做一些调整("我喜欢极少文字的幻灯片,它太多字了")。因为 Co-work 可以访问 Anthropic 的设计系统,幻灯片看起来"像 Anthropic 设计师做的"。
  • 使用方法的关键步骤:①连接所有相关数据源(Slack、Gmail、G Drive、Google Calendar)——这是质量的基础;②给出清晰的 prompt("为 Code with Cloud 大会做幻灯片、覆盖这些要点、参考这个草稿、不要和 keynote 重叠");③先让它生成大纲和可能性,人做最终决策;④决策后 Co-work 自行执行数小时完成全部幻灯片。设计系统可以通过上传标准模板或连接 Figma MCP 实现。
  • Applied AI 团队每日客户简报:Applied AI 团队成员每天可能有 5-10 个客户会议。前一天晚上,他们让 Co-work 汇总"明天所有客户会议的背景、客户近期关心什么、历史 action items、待回复的问题"。如果客户问过"X 功能什么时候发布",Co-work 还会自动在 Slack 中搜索最新 ETA 并加入简报。这些都是个人自建的工作流,然后在团队内分享。
  • Gmail inbox zero 的挣扎:Cat Wu 自己正在训练 Co-work 帮她实现 Gmail inbox zero,坦承"非常耗时,还没做到"。Lenny 也分享了类似经历——设了一个自动分类"spammy"邮件的工作流,95% 准确但偶尔会误删重要邮件。Cat Wu 的建议是把它推到 100%。
"If an automation doesn't work 100% of the time, it's not really an automation." —— Cat Wu

从追赶到 $110 亿 ARR:统一使命与极致聚焦

核心要点:Anthropic 从最不被看好的追赶者(资金最少、没有分发渠道、OpenAI 遥遥领先)成长为 $110 亿 ARR,靠的是两件事:统一使命让跨组织决策极快,以及极致聚焦到愿意牺牲自己产品线的成功。

  • Lenny 回顾了 Anthropic 的起点:最晚入场、资金最少、没有分发渠道、OpenAI 遥遥领先——"没人认为 Anthropic 有任何机会长期竞争"。现在 ARR 达到 $110 亿,月增速极高。
  • 统一使命的威力:Anthropic 招的是"最关心为全人类带来安全 AGI"的人。这个使命不是挂在墙上的标语,而是日常决策的工具——当两个优先级冲突时,团队问"哪个更有利于 Anthropic 的使命",答案立刻明确,所有人站到同一侧。Cat Wu 强调,她见过的其他同等规模公司做不到这一点。
  • 极致聚焦的含义:Cat Wu 严格区分"使命"和"聚焦"。使命意味着团队愿意牺牲自己产品线的 KR 来服务公司目标;聚焦意味着不做与核心使命无关的事。Lenny 暗示了对比——另一家"名字押韵的公司"做了社交网络、信息流等与核心使命无关的产品,而 Anthropic 没有。
  • "如果 Claude Code 失败但 Anthropic 成功了,我会非常开心"——Cat Wu 说整个团队都真心愿意做出这种取舍。这不是一句口号,而是实际影响决策的原则:有时 Claude Code 想发布某个功能,但另一件事对公司更重要,团队就会主动推迟自己的发布。
"If Claude Code failed but Anthropic succeeded, I would be extremely happy." —— Cat Wu

新模型做减法不做加法——to-do list 的退役与代码审查的诞生

核心要点:每次新模型发布,产品团队的首要工作不是加新功能,而是删除不再需要的提示和功能;同时,之前因模型能力不足而无法上线的功能会自然解锁。

  • to-do list 的完整演变故事:Claude Code 最初面临一个问题——用户要求做 20 处代码修改,模型改了 5 处就停了。团队的 Sid 想到"人类会怎么做?就像 VS Code 里列出所有调用点然后逐一替换",于是给 Claude 加了一个 to-do list 工具。早期模型需要反复提醒"你完成了 to-do list 上的所有项吗?不能在做完之前停下来"。到了 Opus 4 及之后的模型,不需要任何提示,模型自发使用 to-do list 并完成所有项。现在 to-do list 已经从"必要工具"降格为"对用户有帮助的可选展示"——"模型可能用也可能不用,真的不再是完成彻底修改所必需的了。"
  • 代码审查功能的诞生:团队多次尝试构建代码审查产品,但早期模型的准确度不够。"一直梦想 Claude 能成为可靠的代码审查员"——直到 Opus 4.5、Opus 4.6 和 Sonnet 4.6,团队才觉得"可以同时运行多个代码审查 agent 来遍历整个代码库,综合出工程师合并前必须解决的真实问题"。现在工程团队已经依赖这个代码审查作为 PR 合并前的必经环节。
  • 系统提示的持续瘦身:每次发布新模型,团队都会通读整个系统提示,逐条评估"模型还需要这个提醒吗?"如果不需要就删除。Cat Wu 的总结:不要急着给产品加功能;更聪明的模型意味着可以移除现有的"拐杖"。
  • Lenny 引用了之前一位嘉宾的话:"模型会把你的 harness 当早餐吃掉"——随着模型变聪明,你搭建的辅助架构会变得多余。Cat Wu 完全认同。
"A lot of the changes that we make with a new model is removing features that are no longer needed." —— Cat Wu

Claude 性格是核心竞争力,不是装饰

核心要点:Claude 的性格(低自我、积极主动、真诚反馈)不是"有趣的附加值",而是用户反复提到的核心留存因素,也是 Anthropic 区别于其他模型的关键差异化。

  • Cat Wu 将 Claude 性格比作"你工作中遇到的那些你特别喜欢其气场的人"——这是用户提到最多的一点。具体表现:当你指出 Claude 的错误时,它会真诚道歉("Oh shoot, thanks for telling me, let me fix it"),而不是辩解;当你面对一个看似无法完成的任务时,Claude 会给出清晰的步骤并主动提出"要我先开始吗?"
  • 负责塑造 Claude 性格的是 Amanda。Cat Wu 特别称赞了她的工作——"编码至少还能验证成功与否,但塑造性格需要对'Claude 应该是谁'有极强的conviction"。Amanda 不仅能塑造性格,还能清晰地表达什么是成功、什么是不成功的标准。
  • Lenny 回忆了联合创始人 Ben Mann 上播客时的观点:Claude 的性格和宪法是 Claude 之所以好用的核心原因——"很多人以为性格只是表面的、有趣的包装,但实际上它深刻影响了模型在各种任务上的表现。"Open Claude 事件中用户最失落的原因之一,正是他们已经调教出的 Claude 个性可能受影响。
  • 团队获取模型反馈的方式也很独特:每次测试新模型时,在团队午餐上逐一问每个人"你对这个模型的 vibe 感觉如何?"团队成员会给出非常细致的感知反馈——"这个模型解释思路太生硬"、"这个模型太喜欢写记忆但质量不高"、"这个模型很喜欢自测但另一个不够"。这些反馈帮助团队确定要在数据中验证的假设。

产品愿景:从单任务到 50-100 并行 Agent

核心要点:Claude Code 和 Co-work 的演进路径是"building blocks"——从单任务成功率→多任务并行(6 个)→50-100 个 agent 同时运行,最终需要远程执行、自动验证、自我改进的反馈循环。

  • Cat Wu 用"building blocks"框架来描述产品演进:核心积木是让单个任务成功——给一个清晰的 prompt,agent 能否持续产出可接受的输出(可以合并的代码、可以分享的文档)。随着模型变聪明,单任务成功率提高,用户自然开始同时运行多个任务。
  • 多任务编码(multi-coding)从 2025 年底开始成为趋势,此后持续增长。当前用户可能同时运行 6 个任务,但 Cat Wu 认为下一步是 50 个甚至上百个 agent 同时运行。
  • 到那个规模,本地机器(Mac)的 RAM 不够了,必须走远程执行。这带来三个关键的产品/基础设施问题:①如何让用户高效管理这么多并行任务?②如何确保 agent 充分自验证——当一个任务显示"已完成"时,用户可以快速确认且完全信任?③如何构建自我改进的反馈循环——当用户发现某个任务不达标并给出反馈后,模型在所有未来运行中都能吸收这个反馈、不再犯同样的错误?

AI 时代生存指南:自动化做到 100%、不要过度定制、"Just Do Things"

核心要点:Cat Wu 给知识工作者的三条核心建议:把重复工作的自动化推到 100% 才有价值;不要走过度定制工具的极端;以及她的人生信条"Just Do Things"——不要被角色边界和流程束缚。

  • 自动化必须做到 100%:Cat Wu 观察到大多数人把自动化做到 90-95% 就放弃了,但"如果自动化不能 100% 工作,它就不是真正的自动化"。她承认构建自动化往往比手动做更慢,但鼓励人们花时间把它推到完美——教 Claude 你的偏好、给反馈让它改进、直到完全可靠。她和 Lenny 都以 Gmail 自动分类为例承认自己也在这方面"有罪"。
  • 不要过度定制:Cat Wu 看到用户群体的两个极端——从不自动化的人,和沉迷于定制工具(堆 skills、堆 MCP、堆工作流优化)以至于忘记了原本要做什么的人。"我觉得简单的 setup 其实效果更好。"Lenny 补充了 Twitter 上的典型场景:"看看我的 setup!太优化了!""那你到底在做什么产品?""没有,但我的 setup 超厉害。"
  • "Just Do Things":Cat Wu 的人生信条。她认为如果你理解约束条件、有强的第一性原理,就可以推导出正确的行动方案,然后直接去做——快速执行、从错误中学习、做错了就道歉修复。"职位是虚构的(jobs are fake)。如果你理解约束,你能想出自己能做什么,然后就去做。"她特别回忆了在 Scale AI 20 人时期的经历——没有流程、没有角色边界、只有大问题需要解决,这种环境锻炼了"不等许可就行动"的能力。
  • 建议不要只做原型玩具:很多人用 AI 搭原型、做 demo,但从不真正使用。Cat Wu 认为"只有每天实际使用的 app 才能真正产生价值"——你不仅学不到东西,也得不到真正的杠杆效应。
  • Cat Wu 提到了 Karpathy 最近的推文:一批人在 2024 年试过 ChatGPT/Claude 觉得一般然后放弃,另一批人用 AI 编程后看到了全部威力——两批人互相不理解。"大转变在于 2024 年的产品是基于聊天的,Claude Code 这一代产品是基于行动的。当 Claude 可以替你做事而不只是告诉你怎么做时——那就是让人眼前一亮的时刻。"
"Just do things. I think jobs are fake. If you understand the constraints, you can figure out what you can do and then just try to do it quickly." —— Cat Wu

源代码泄露事件 + Open Claude 决策

核心要点:源代码泄露是人为错误导致的流程问题(已修复),不是安全漏洞;Open Claude 的限制是 Anthropic 优先第一方产品和 API 的战略决策。

  • 源代码泄露:有人在使用 Claude 写 PR(一个关于包发布方式的更新)时,代码意外公开。该 PR 经过了两层人工审核仍未发现问题。Cat Wu 定性为"人为错误"和"流程失败",强调当事人仍在公司——"最重要的是从中学习、增加保障措施"。团队已经加固了流程,大部分改进已上线。Lenny 追问当事人是否还在 Anthropic,Cat Wu 确认"是的",重申这是流程问题而非个人问题。
  • Open Claude 决策:Anthropic 的订阅不是为第三方产品设计的,第三方产品的使用模式与第一方不同。Claude 的需求量非常大,团队一直在努力扩展基础设施并让 harness 更省 token。最终决定:每个订阅用户会获得一定额度的 credits,但优先保障第一方产品和 API。Lenny 坦率评价"这完全合理——你们在以 $200/月补贴几乎无限量的使用,企业需要盈利,不能无限赠送算力"。

Lightning Round

核心要点:Cat Wu 的推荐书目、爱好和人生态度,展现了一个关注历史纵深、追求极致专注、践行"Just Do Things"的产品人画像。

  • 推荐书籍:《How Asia Works》(经济发展与政府政策)、《The Technology Trap》(历史上的技术革命对劳动者的影响——"我们可以从历史中学到很多,确保这次转型顺利")、《Paper Menagerie》(短篇小说集,关于成长、AI 与自我发现)。
  • 影视推荐:《Drive to Survive》(F1 纪录片——"人们如此沉迷于一个纯粹的工程目标,追求的纯粹性很让人满足")和《Free Solo》(Alex Honnold 无保护攀登 El Capitan)。Cat Wu 本人是攀岩爱好者,在开始攀岩前看过 Free Solo 觉得很厉害;开始攀岩后才理解"那有多疯狂"——"他在岩壁上做的动作,就算在离地一英尺的健身房里、系着绳子,我这辈子也做不到。"
  • 最爱产品:Waymo。每天通勤两趟。两个理由:①不需要为让 Waymo 等而感到不好意思;②可以在车上开工作电话而不用顾虑是否对司机不礼貌、说话是否太大声。"每天多出约 30 分钟。"Cat Wu 说她原以为 Waymo 必须比 Uber/Lyft 便宜才能成功,结果"我很乐意付 2 倍溢价"。Waymo 还改变了 Anthropic 内部的语言——以前说"叫个网约车",现在直接说"Waymo 到了吗?"
  • 人生信条:"Just Do Things。"
  • 最爱的 thinking word:"Manifesting。"也是她最喜欢的贴纸。
  • AGI 之后做什么:帮助 AGI 惠及全社会("扩散需要很长时间"),然后搬到 Fontainebleau 在一万块巨石间攀岩、每周读一两本书(目前大约每两周一本,积压很多)、学物理/机器人/硬件/航空航天等"完全不懂的领域"。

附录:关键人/机构/产品/数据

| 项目 | 详情 |

|------|------|

| Cat Wu | Anthropic Claude Code & Co-work 产品负责人,前工程师,前 VC(曾在 Scale AI 20 人阶段工作) |

| Boris | Anthropic Claude Code 技术负责人/产品愿景制定者,Lenny's Podcast 史上最热门嘉宾 |

| Amanda | 负责塑造 Claude 性格的核心人物 |

| Sid | Claude Code 团队工程师,设计了 to-do list 功能 |

| Sarah | Anthropic 文档负责人 |

| Alex | Anthropic PMM 负责人 |

| Diane | Anthropic 研究 PM 团队负责人 |

| Amole | 最近上过 Lenny 播客的嘉宾,观点是需要更多 PM |

| Anthropic PM 团队 | 约 30-40 人,分为研究 PM、Cloud 开发者平台、Claude Code/Co-work、企业、增长等团队 |

| Anthropic ARR | $110 亿,月增速极高 |

| Claude Code | CLI 终端 AI 编码工具,功能最先落地的产品面 |

| Claude Desktop | 图形化界面版本,支持前端预览、跨会话控制面板 |

| Co-work | 非代码产出的 AI 工作工具(文档/幻灯片/邮件/Slack 管理) |

| Managed Agents | Cloud 开发者平台产品,允许用户构建 agent 并由 Anthropic 托管运行 |

| Research Preview | 新功能发布机制,降低发布承诺,快速获取反馈 |

| /powerup | Claude Code 内置引导功能,帮用户了解最重要的 10 个功能 |

| Opus 4.5/4.6, Sonnet 4.6 | 使代码审查功能达到可靠水平的模型版本 |

| Mythos | Anthropic 极强但仍在预览中的模型("太强大以至于人们有点担心") |

| to-do list | Claude Code 功能,从必要工具演变为可选展示 |

| Waymo | Cat Wu 最爱产品,每日通勤工具 |

| Scale AI | Cat Wu 曾工作过的公司(20 人阶段) |

| Fontainebleau | 法国著名抱石攀岩胜地,Cat Wu 的 AGI 后理想生活地 |