← 返回
88 min 2026-02

Head of Claude Code: What happens after coding is solved | Boris Cherny

概要

Claude Code负责人Boris Cherny讲述从终端原型到占GitHub 4% commit的增长故事,以及coding solved后的agent化方向

核心洞察

  • Claude Code 从一个内部获得 2 个赞的终端 hack 成长为全球软件工程的基础设施:Semi Analysis 报告显示,GitHub 上 4% 的 commit 由 Claude Code 生成(私有仓库比例更高),预计年底达到 20%。Boris 自 2024 年 11 月起未手动编辑过一行代码,每天提交 10-30 个 PR,而 Anthropic 工程团队规模扩大约 4 倍的同时,人均生产力提升了 200%。
  • "编程已基本被解决",下一个前沿是 AI 自主发现要做什么:Claude 已经开始从用户反馈、bug 报告和遥测数据中主动提出修复建议和功能创意,Boris 认为编程本身已是"solved problem",软件工程师的头衔将在年底开始被"builder"取代。
  • Latent demand 是 Boris 眼中最重要的产品原则:从 Facebook Marketplace(40% 群组帖子是买卖)到 Claude Code 被非技术用户用来种番茄、分析基因组,再到数据科学家 Brendan 自学终端使用 Claude Code 做 SQL 分析,每一次"产品被滥用"都指向了下一个爆款——Co-work 正是这样诞生的。
  • Co-work 由团队用 Claude Code 在 10 天内构建(含完整 VM 安全沙箱),发布即爆款:对比 Claude Code 早期的慢热,Co-work 上线后迅速被百万级用户采用;Anthropic 一位 PM 用 Lenny 发布的 50 个非技术用例作为 eval,48/50 通过后才决定发布。
  • Anthropic 的安全架构分三层——机制可解释性、评估、真实世界部署——这是 Boris 选择留在 Anthropic 而非 Cursor 的根本原因:他加入 Cursor 两周后因缺少使命感而回归,认为"无论工作多 exciting,都不能替代 mission"。

加入 Cursor 两周后回归:Mission 不可替代

核心要点:Boris 经历了职业生涯中最快的一次换工作——加入 Cursor 两周后回到 Anthropic,因为意识到产品的兴奋感无法替代使命感。

Boris 是 Cursor 产品的忠实用户,也被团队打动——他至今仍认为 Cursor 团队"awesome",在 AI 编程方向的判断力领先于很多人。但到了 Cursor 之后,他几乎立刻意识到自己真正缺少的是 Anthropic 的使命。他最初加入 Anthropic 就是被安全使命吸引的:在大厂工作后,他想去一家实验室"帮助塑造这个疯狂的东西的未来"。在 Anthropic,随便在走廊上拦一个人问"你为什么在这里",答案永远是"safety"。

"Whatever the work might be, no matter how exciting, even if it's building a really cool product, it's just not really a substitute for that." —— Boris Cherny

Boris 说这是他"最快的一次换工作"(the fastest job change I've ever had),Lenny 也表示从未听过这个故事的完整版本。

Claude Code 起源:从"没人看好的终端 hack"到改变软件工程

核心要点:Claude Code 的诞生是务实选择与产品直觉的结合——选终端是因为只有一个人所以"最简单",而"内部发布获 2 个赞"恰恰是一个重要的产品教训:早期要刻意 underresource。

Boris 加入 Anthropic 后,先花一个月做各种奇怪的原型(大部分没发布),再花一个月做后训练以理解模型——他认为"要做好上层工作,就必须理解下面一层"。之后他开始原型开发,最初叫 QuadCLI。

"我在听什么歌"的顿悟时刻:Boris 给模型一个 bash 工具,没有任何指令说明用途。他问模型"我在听什么歌"——模型自己想出了如何用 bash 工具来回答这个问题。Boris 自己都不确定模型能不能回答,但模型做到了。这个瞬间让他意识到模型存在 latent demand——它"想要"做的事情远超设计者的预想。

他把这个原型发布到内部,获得了两个赞。没人觉得终端产品能行——大家想到编程工具就想到 IDE 和复杂环境,没人认为这东西能基于终端。但终端形态其实是务实选择:头几个月只有 Boris 一个人,终端是最简单的构建方式。

"No one thought that this thing could be terminal-based. That wasn't really the intention, but for the first couple months it was just me, so it was just the easiest way to build." —— Boris Cherny

后来团队考虑过其他形态,但决定继续坚持终端——因为模型进步太快,他们觉得没有其他形态能跟上。2025 年 2 月外部发布后,Claude Code 并没有立刻成为爆款,早期用户需要时间理解这个"有点奇怪"的产品。真正的拐点来自 Opus 4——Anthropic 第一个 ASL-3 级模型发布后,增长曲线开始指数级上升,此后一直在加速。Ben Man 在很早期就催促 Boris 做 DAU 图表,Boris 还觉得太早了,但图表"几乎立刻就垂直上升了"。

100% AI 写代码:从预测到现实

核心要点:Boris 在 2025 年 5 月预测"年底可能不再需要 IDE"时,全场倒吸一口气——但他只是在"描线"(trace the line),而 Anthropic 的 DNA 就是指数思维。

Boris 自 2024 年 11 月起未手动编辑过一行代码,每天提交 10-30 个 PR,录制本期播客时同时运行着 5 个 agent。但这个过程是渐进的:2025 年 2 月 Claude Code 只写他 20% 的代码,5 月约 30%(他大部分代码仍用 Cursor 写),直到 11 月才跨过 100%。

  • Anthropic 三位联合创始人是 scaling laws 论文的前三位作者,指数思维"深入 DNA"
  • Spotify 最近宣布其最优秀的开发者自 12 月以来没有手写过一行代码
  • Semi Analysis 数据只统计公开 commit,私有仓库比例"相当高于"4%
  • 有些工程师甚至已经不看代码了——Boris 认为目前还需要人工检查正确性和安全性,Anthropic 也让 Claude 自动 review 100% 的 PR,但之后仍有人工复核层
"I have never enjoyed coding as much as I do today because I don't have to deal with all the minutia." —— Boris Cherny

新人用 Claude 修 memory leak 比 Boris 快——AGI-forward 思维方式的冲击

核心要点:模型进步太快,即使长期使用者也会被旧思维困住;新工程师反而因为没有"旧包袱"而更高效。

几个月前 Claude Code 出现内存泄漏。Boris 按传统方式处理:取 heap snapshot,打开专用 debugger,逐行分析 trace。团队里一位较新的工程师则直接对 Claude Code 说:"Hey Claude, it seems like there's a leak. Can you figure it out?" Claude Code 做了和 Boris 完全相同的事——取 heap snapshot——然后自己写了一个即时分析工具(just-in-time program),用它分析了 snapshot,找到了问题,提交了 PR,整个过程比 Boris 手动操作还快。

Boris 由此总结:长期使用模型的人反而容易停留在"旧模型的心智"里("it's not Sonnet 3.5 anymore"),需要不断将自己拉回当下。新人和新毕业生反而用更 AGI-forward 的方式工作。

团队原则:Underfunding、速度、无限 Token

核心要点:刻意少配人不是为了省钱,而是为了逼出 AI-native 的工作方式;给工程师无限 token 不是因为 Anthropic 卖 token,而是因为创新需要试错自由。

  • 刻意少配人(underfund):有时一个项目只放一个工程师。当资源紧张时,工程师被迫让 Claude 做更多工作,反而产出更好。Boris 对 CTO 们的建议是:不要一开始就优化成本,先给工程师尽可能多的 token
  • 速度至上:如果一件事今天能做,就今天做。早期 Claude Code 只有 Boris 一个人,唯一的优势就是速度——这至今仍是团队原则
  • 无限 token 作为福利:Anthropic 已有工程师月消耗数十万美元的 token。Boris 认为个人实验阶段 token 成本相对薪资很低,等想法验证成功再优化(比如用 Haiku 或 Sonnet 替代 Opus),不要过早省钱
  • Lenny 调侃"当然你说这话,你在 Anthropic 工作",Boris 回应说小规模实验的 token 成本确实远低于工程师薪资
"Don't try to optimize. Don't try to cost cut at the beginning. Start by just giving engineers as many tokens as possible." —— Boris Cherny

Latent Demand:从 Facebook Marketplace 到 Co-work 的产品发现法

核心要点:当用户"滥用"你的产品去做它本来不该做的事时,这就是最强的产品信号——Co-work 正是从"有人在终端里种番茄"这类现象中诞生的。

Facebook Marketplace 案例:Marketplace 团队创始经理 Fiona 发现,2016 年前后 Facebook 群组中 40% 的帖子是买卖东西——没人设计这个功能,用户自己 hack 出来的。结论显而易见:为买卖专门做个产品,一定会成功。Facebook Dating 也类似:60% 的个人主页浏览来自异性非好友——用户在"偷看"彼此。

Brendan 数据科学家终端故事:大约 2025 年 5 月,Boris 走进办公室,看到数据科学家 Brendan 的电脑上居然开着终端——Boris 震惊了:"Brendan,你怎么会打开终端?"(终端是工程师的工具,很多工程师自己都不想用。)Brendan 不仅打开了终端,还自己下载了 Node.js 和 Claude Code,正在终端里做 SQL 分析。第二周,所有数据科学家都在做同样的事。

其他"滥用"案例:有人用 Claude Code 种番茄、分析自己的基因组、从损坏硬盘中恢复婚纱照、分析 MRI 影像。Boris 看到这些非技术用户"跳过重重障碍去用一个终端产品",意识到应该为他们做一个专门的产品——这就是 Co-work 的起源。

Boris 还提出了 latent demand 的"第二维度":不只看用户想做什么,还要看模型想做什么。Claude Code 的设计哲学是"产品就是模型本身"——给模型最少的脚手架、最少的工具,让它自己决定用什么工具、按什么顺序用。研究中叫"on distribution",产品中叫 latent demand,是同一个概念。

Co-work:10 天构建,发布即爆款

核心要点:团队探索了好几个月各种方案,最终有人说"把 Claude Code 放进桌面 app 不就行了"——10 天用 Claude Code 自身完成全部实现,包括完整的 VM 安全沙箱。

Claude Code 外部发布后经历了慢热期,用了好几个月人们才理解这个产品是什么。Co-work 则完全不同——上线后立刻被百万级用户采用,增长远快于 Claude Code 早期。

Boris 把功劳归于团队(Felix、Sam、Jenny 等人),但核心推动力仍是 latent demand:团队看到人们在用 Claude Code 做非技术任务,花了几个月探索各种方向,最终有人提出最简单的方案——把 Claude Code 放进桌面应用。10 天内完成全部实现,包括一个完整的虚拟机安全系统以确保模型不会"跑偏",所有代码由 Claude Code 编写。产品以"research preview"形态提前发布,因为一方面需要用户反馈来改进产品,另一方面需要在真实世界中研究安全性。

"我成了 eval":Lenny 曾发过一个帖子列出 50 个非技术用例。Anthropic 一位 PM 用这个帖子作为 Co-work 的评估标准——当 Co-work 能完成其中 48 个时,他们才决定发布。Lenny 听到后大笑:"我成了 eval?" Boris 说:"这是反向突破。"(reverse breaking through)

Boris 自己每天用 Co-work 处理各种非编程任务:缴停车罚单、团队项目管理(在电子表格和 Slack 之间同步状态、每周一自动催未填进度的工程师)、回复邮件、取消订阅——Co-work 也帮同事在产假期间填写了繁琐的医疗表格。

印刷术类比:编程正在经历 500 年前的识字民主化

核心要点:中世纪不到 1% 的人会读写,印刷术发明后 200 年全球识字率升至 70%——编程正在经历同样的转变,Boris 认为这将催生一个"所有人都能编程"的世界,其影响像文艺复兴一样不可预测。

  • 15 世纪中叶欧洲识字率不到 1%,只有抄写员掌握读写技能,受雇于自己都不识字的贵族
  • 印刷术发明后 50 年,印刷材料总量超过此前 1000 年的总和;成本在 50 年内下降约 100 倍
  • 识字率花了 200 年才升到 70%(需要教育体系、空闲时间——不能整天在农场干活)
  • Boris 找到一份历史文献:一位 15 世纪的抄写员被问到对印刷术的感受,回答竟然很兴奋——"我不喜欢的是在书本之间抄来抄去,我喜欢的是画插图和装帧书籍,现在时间终于被释放出来了"。Boris 说自己作为工程师有完全相同的感受:编程中烦人的细节工作没有了,留下的是思考构建什么、与用户对话、与团队协作
  • 但短期内会"非常具有破坏性"(very disruptive)且"对很多人来说很痛苦"——Boris 强调这需要全社会共同讨论

AI 产品构建三条建议:不要框住模型、Bitter Lesson、为 6 个月后的模型构建

核心要点:绝大多数 AI 产品的错误在于给模型加太多脚手架——scaffolding 带来的 10-20% 性能提升会被下一代模型直接抹掉。

  • 不要把模型关在盒子里:很多人的直觉是给模型严格的工作流(必须先做步骤一、再做步骤二),用复杂的 orchestrator 控制。但几乎总是直接给模型工具 + 目标、让它自己决定执行顺序能拿到更好结果。一年前也许需要脚手架,现在不需要了
  • Bitter Lesson:Rich Sutton 约 10 年前的博客文章——更通用的模型永远胜过更专用的模型。推论:不要用小模型、不要 fine-tune(除非有特殊原因),尽可能押注最通用的模型
  • 为 6 个月后的模型构建:Claude Code 最初只写 Boris 20% 的代码,但从第一天起就赌"模型终将好到可以写所有代码"。这意味着头 6 个月产品市场匹配会很差,但模型能力到位时"你已经准备好了,产品会 click"。Opus 4 发布后 Claude Code 的增长印证了这一策略

Boris 分享了两个可以下注的方向:模型会越来越擅长使用工具和电脑;模型会越来越能长时间无人看管地运行——从 Sonnet 3.5 时代的 15-30 秒到 Opus 4.6 的 10-30 分钟,现在甚至可以运行数小时甚至数天。

安全三层架构:从神经元到真实世界

核心要点:Anthropic 在模型安全上建立了三层防线——机制可解释性、实验室评估、真实世界部署——Claude Code 在内部测试了 4-5 个月才外部发布。

  • 第一层:机制可解释性(Mechanistic Interpretability)——由 Chris Olah 开创的领域。研究模型内部神经元的行为,已能追踪到特定概念对应的神经元(如"欺骗"相关的神经元是否被激活)。模型变大后出现"超位"(superposition)现象:单个神经元可能对应十几个概念,多个神经元共同激活时代表更复杂的概念。已有较强证据表明模型"不只是在预测下一个 token,而是在做更深层的事情"
  • 第二层:Eval——把模型放在"培养皿"中,给它合成场景,观察它的行为是否对齐、是否安全
  • 第三层:真实世界部署——前两层表现好的模型在真实世界中可能表现不同。Claude Code 在内部使用了 4-5 个月才对外发布,Co-work 也经历了类似流程
  • Anthropic 开源了 agent 沙箱,兼容任何 agent 而非仅限 Claude Code——Boris 称之为"race to the top"策略

角色融合:PM、工程师、设计师的 50% 重叠

核心要点:Boris 预测年底"软件工程师"头衔将开始消失,被"builder"取代——Claude Code 团队已经在实践这一点:PM 写代码,设计师写代码,财务写代码,数据科学家写代码。

  • Claude Code 团队每个人都写代码——PM、工程经理、设计师、财务、数据科学家
  • 三个角色之间已有约 50% 的重叠;差异在于专长方向(Boris 偏重编码,PM 偏重协调/规划/预测)
  • 最强的工程师往往跨学科:产品 + 基建混合型、有设计感的产品工程师、懂商业的工程师、爱和用户聊天的工程师
  • Lenny 调查:70% 的工程师和 PM 表示使用 AI 后更享受工作,仅 10% 觉得变差;但设计师只有 55% 觉得更好、20% 觉得变差——Boris 对此也很好奇,想深入了解原因
  • Boris 的建议:成为通才,跨越学科边界,不要只做工程——这比单纯掌握 AI 工具更重要
"I think by the end of the year, everyone's going to be a product manager and everyone codes. The title software engineer is going to start to go away." —— Boris Cherny

个人故事:敖德萨、打孔卡、TI-83 作弊、日本味噌

敖德萨同乡

访谈中 Boris 提到自己出生在乌克兰,Lenny 随口问"哪个城市",Boris 说"敖德萨"——Lenny 惊呼"我也是!"两人大笑。Boris 家 1995 年移民美国,Lenny 家更早(1988 年)。Boris 说"我每天都觉得自己很幸运能在这里长大",Lenny 的家人则每逢任何好事都会举杯"to America!"——Boris 笑着说"我们也是同样的 toast,但还是用伏特加"。

爷爷是苏联第一代程序员

Boris 的外公是苏联最早一批程序员,用打孔卡编程。母亲小时候的记忆是:外公带回家一大摞打孔卡,她就在上面用蜡笔画画。外公没有活到软件时代的到来。Boris 由此类比:当年从打孔卡到软件的转变中,老一辈程序员也许不把软件"当作真正的编程"——每一代都经历同样的转变。

TI-83 作弊故事

Boris 自学编程的起点是为了在数学考试中作弊:把答案编程到 TI-83 Plus 图形计算器里。后来题目太难、无法预知考什么,他就写了一个代数求解器。再后来他发现可以用连接线把程序传给全班——全班都拿了 A,然后被老师抓了。Boris 说从一开始编程对他就是纯粹的工具:"编程是用来做事的方式,不是目的本身。"

日本乡下与味噌

加入 Anthropic 之前,Boris 住在日本乡下——镇上唯一的工程师、唯一的英语使用者。每周骑车路过稻田去农贸市场,和邻居交换腌菜来建立友谊。他学会了做味噌:白味噌至少 3 个月,红味噌 2-4 年。"味噌教会我用长时间尺度思考"——这和工程世界完全不同。他也在那个时期读了大量科幻小说,开始思考 AI 的长期走向,最终决定必须"为这件事走向好的方向做点贡献",于是加入 Anthropic。

被问到"AGI 之后你打算做什么",Boris 说:做味噌

Lightning Round:书、产品、座右铭、推特

  • 推荐书:(1) Functional Programming in Scala——"我读过的最好的技术书",Scala 本身不一定用得上,但函数式编程和类型思维塑造了他的编码方式;(2) Accelerando(Charles Stross)——科幻小说,节奏越来越快,从 liftoff 到"集体龙虾意识绕木星运行",跨越几十年,"比任何书都更能捕捉当下这个时刻的本质";(3) 流浪地球(刘慈欣短篇集)——比《三体》更喜欢短篇集,"中国科幻提供了和西方完全不同的视角"
  • 最近最喜欢的产品:Co-work——"确实改变了我的生活",Chrome 集成特别好用,帮他缴罚单、取消订阅、处理日常琐事
  • 人生座右铭:Use common sense——他见过最多的失败是人们不动脑子地跟流程、跟惯性。最好的结果来自第一性原理思考
  • 为什么开始用 Twitter:2025 年 12 月在欧洲旅行时太无聊,打开 Twitter 看到有人讨论 Claude Code 的 bug 就开始回复。他用 Claude Code 几分钟内就能修复用户报告的 bug——用户对这个速度感到震惊,这让他觉得 Twitter 值得继续。之前他主要用 Threads(因为他参与过 Threads 的早期开发)

附录:关键人/机构/产品/数据

:关键人/机构/产品/数据

| 项目 | 详情 |

|------|------|

| Boris Cherny | Anthropic Claude Code 负责人,前 Meta/Instagram 工程师,TypeScript 书作者 |

| Lenny Rachitsky | 播客主持人,同为乌克兰敖德萨出生 |

| Ben Man | Anthropic 联合创始人,早期催促 Boris 做 DAU 图表,提议"post-AGI 问题" |

| Chris Olah | Anthropic 机制可解释性领域开创者 |

| Fiona | Facebook Marketplace 团队创始经理 |

| Brendan | Anthropic 数据科学家,自学终端使用 Claude Code 做 SQL 分析 |

| Felix, Sam, Jenny | Co-work 核心构建团队成员 |

| Claude Code | Anthropic 编程 agent,GitHub 4% commit 占比,预计年底 20% |

| Co-work | Claude 桌面端非技术任务 agent,10 天构建,发布即爆款 |

| MCP | Anthropic 构建的协议(与 Claude Code 同一时期由同一团队产出) |

| Opus 4 / 4.6 | Anthropic ASL-3 级模型,Claude Code 增长拐点始于 Opus 4 发布 |

| Sonnet 3.5 | 早期模型基准,当时 agent 只能运行 15-30 秒 |

| Semi Analysis 报告 | GitHub 4% commit 来自 Claude Code,预测年底 20% |

| Anthropic 融资 | 最新一轮估值超 3500 亿美元 |

| Claude Code 收入 | 约 20 亿美元;Anthropic 整体约 150 亿美元 |

| 工程生产力 | Anthropic 人均 PR 产出提升 200%,团队规模约扩大 4 倍 |

| 工程师 token 消耗 | 部分 Anthropic 工程师月消耗数十万美元 token |

| Bitter Lesson | Rich Sutton 博客文章,核心论点:更通用的模型永远胜过更专用的模型 |

| Scaling Laws | Anthropic 三位联合创始人是该论文前三位作者 |

| Lenny 的 50 个用例 | 被 Anthropic PM 用作 Co-work 发布前的 eval 标准(48/50 通过) |