把公司重构成「递归自我改进的 AI 循环」——Tom Blomfield 在 YC 的演讲

节目

YC Root Access

嘉宾

Tom Blomfield

日期

2026-05

时长

13 min

查看原始内容 →

概要

核心命题：别再把 AI 当成"给工程师提效 20%"的工具，而要把整个公司重新想象成一组"递归自我改进的 AI 循环"（recursive self-improving AI loops）。 做到这一步，公司"连你睡觉时都在自我变好"。

今天的公司是"罗马军团"——靠嵌套层级、一致管理跨度、具名个人来上传下达信息，人是信息流动的管道。Tom 认为 AI 从根本上打破了"层级制是组织经济价值单元的正确方式"这个底层假设。

真正的"aha moment"是自我改进，而非提效。 YC 给查询 agent 加了一个"监控 agent"：它盯着每个员工的每次查询，发现查询失败时自动追问"为什么失败、缺什么工具"，然后隔夜写代码、向 YC 代码库提 merge request、由另一个 agent review 并合并部署——次日同样的查询就能成功。这不是 +20%，是系统自己把自己改好了。

两个组织含义：① "烧 token，不是烧 headcount" ——YC 看到公司在 demo day 的人均收入比 18 个月前高约 5 倍，未来瓶颈是 token 用量而非人头；② 中层管理终结——协调问题交给 AI，人人都做 IC（builder/operator），但每件事都需要一个"具名负责人(DRI)"，是单个人而非委员会。

落地三招：让全公司"对 AI 可读(legible)"。 录下一切（"没被记录，对你的 AI 就等于没发生过"）、把海量录音 diarize 后合成成"面包屑"喂给 AI；珍藏所有原始数据、把上层软件当成即用即抛(ephemeral)、模型变强就重新生成；人则退到"公司大脑"的边缘，只在新情境、伦理、高风险时刻和销售对话里出场。

公司是"罗马军团"，而 AI 打破了层级制的底层假设

核心论点：今天绝大多数公司仍按罗马军团的方式组织——人是信息上传下达的管道；AI 从根本上让这种结构不再必要。

罗马军团的设计是"把权力从罗马中心投射到两个大洲之外"——比如远到苏格兰哈德良长城上的戍卒，靠的是嵌套层级、一致的管理跨度、以及具名个人逐级传令和回传信息。
Tom 引用 Jack Dorsey 几周前的推特：现代公司默认"层级化组织"就是组织经济价值单元的正确方式——而他认为"AI 基本上打破了这一点"。
这场演讲本身是"二手智慧"的坦诚组合：Tom 说它部分基于 Diana Hu 的一个 talk，又"偷"了 Jack Dorsey 的一堆想法拼到一起，定位为"相当概念化、高层次"的公司构建思考。

"如果你想想今天大多数公司，它们的组织方式就像罗马军团——人类是信息上下流动的管道。" —— Tom Blomfield

Copilot 是错误的心智模型：那只是给旧工作方式装个更强的引擎

核心论点：把 AI 理解成"提效工具"是一种被破坏的思维方式；正确的做法是重新想象公司是什么、如何运转。

一年前人们谈 AI 的用处，都在谈生产力：copilot 让工程师效率提升 20%、把 copilot 塞进工作流、多发布点软件。
Tom 引用 Garry Tan 的一篇博客来反驳：那等于"拿旧的工作方式，给它装上一个更强力的引擎"——形没变，只是更快。
他给出一个极具冲击力的判断：随着模型变强，他"真心相信 AI 能产出比一整个工程团队更多的代码"。真正打动他的，是另一件事——把公司里的领域知识抽取出来、定义成 context 或一组 skills。
这些 know-how 散落在人的脑子里、Slack 消息里、邮件里、Notion 里，合在一起定义了"你的公司如何运转"。一旦把它变得"可读(legible)"，公司就能从层级组织跃迁为"AI 原生软件驱动的智能组织"。

"AI 不是你焊在公司侧面的东西，不是发给工程师让他们更高效的工具——你可以把公司重新想象成一组递归自我改进的 AI 循环。" —— Tom Blomfield

自我改进循环的五层结构

核心论点：把公司的每个部分都拆成一个能闭环运转的 AI 循环；只要每一步都能在最少人工介入下跑通，系统就会越来越好。

传感层(sensor layer)："听起来很花哨，其实就是"——客户邮件、support 工单、代码变更、用户退订、产品遥测，即从外部世界获取信息的数据。
策略/决策层(policy layer)：规则——什么能做、什么必须先问人类许可、什么必须记录在案。
工具层(tool layer)：即 Garry 所说的 skills 和 code，本质是确定性 API（如"查我的数据库""看我的日历"），一组 AI 可以调用的工具。
质量门(quality gate)：evals、确定性检查、安全过滤器、高风险事项的人工审核。
学习机制(learning mechanism)：系统与真实世界交互，捕捉哪里没跑通，再回流到顶层重新开始。
关键判断：如果这每一步都能在最少人工介入下完成，"系统就会越来越好、越来越好——就在你睡觉的时候"。

"Aha moment"：监控 agent 让查询系统隔夜自我修复

核心论点：从"agent 当副手(+20~30%)"到"系统自我改进"的跃迁，是加了一个监控层——它发现失败、并自动修好底层能力。

起点（去年的版本）：YC 先做了一个能查数据库的 agent，很简单，比如问"我上次跟这家公司开 office hour 是什么时候？"。后来更聪明了一点：为正在开 office hour 的公司，用不同方式查库 + RAG，给你找出 5 个 petrochemicals（石化）领域相关的创始人来引荐。Tom 强调——这仍然只是个"副手(sidekick)"，让他作为 group partner 高效 20~30%。
转折（aha moment）：他们在上面加了一个监控 agent，盯着每一个 YC 员工的每一次查询，记录它什么时候奏效、什么时候失败。
当查询失败时，监控 agent 会自问："为什么不行？怎样才能让这条查询成功？是要不同的确定性工具吗？要更新 skills 文件吗？要换个数据库吗？要建新索引吗？"
结果：这一切现在"字面意义上隔夜就发生"——写好代码、向 YC 代码库提交 merge request、由一个 agent 来 review、合并、部署。等第二天人类来问同样的查询，它就成功了。
判断：这不是 AI 让你多值 20~30%，而是 AI 自己走完整个循环、想清楚怎么自我改进。只要能识别出公司里像这样运转的部分、把人尽量退到监控/监督的位置，"你就可以朝这个问题猛砸 token，公司会自动变好"。

"对我来说那就是那种'卧槽'的时刻——不是 AI 让你多值 20% 或 30%，而是 AI 走完这个循环、自己想明白如何自我改进。" —— Tom Blomfield

更多可自我优化的循环：产品与客服

核心论点：同一套循环可复制到产品优化和客服上，让人退到只做"判断调用"的监督位置。

产品自优化循环：让一个 agent 翻你的产品分析，找出销售漏斗里摩擦最高的环节，研究最佳实践，上线一个 AB 测试，跑一周，挑出最优版本并部署——然后对产品一遍又一遍地重复。
客服循环：客户建议持续涌入，由一个扮演"首席产品官 + 首席技术官"的 agent 做判断调用——"这条建议我们不想做，丢弃；那条符合路线图，隔夜就写代码、部署、发布给客户"，全程无需人类参与。

含义一：烧 token，不是烧 headcount

核心论点：未来公司的约束是 token 用量而非人头；衡量谁在"token-maxing"是判断该把时间花在哪些人身上的粗略但方向正确的信号。

YC 看到公司"以比 18 个月前高约 5 倍的人均收入(revenue per employee)走到 demo day"，并预计这一趋势会延续到 A 轮、B 轮——"很快你会被 token 用量约束，而不是被人头约束"。
现在阶段的关键是"探索这玩意儿到底能做什么"，所以每个人都该把实验做到极限。
粗暴的衡量办法就是测每个人的 token 用量——Tom 直言"极端来看这显然很蠢、也能被博弈"，一旦变成排行榜、据此晋升或解雇就一定会被钻空子；但方向上，搞清楚组织里谁在 token-maxing、谁没有，是判断"该和哪些员工一起花时间"的好办法。

"烧 token，别烧人头。" —— Tom Blomfield

含义二：中层管理终结，人人是 IC + 具名负责人

核心论点：协调问题该交给 AI，中层管理已经结束；组织只需要两类角色——人人是 IC，加上对每件事负责的"具名个人"。

"我就是不认为这个协调问题还需要中层管理，AI 应该来做这件事。"
Tom 说 Jack Dorsey 提了三个角色，"我不喜欢第三个，所以把它删了"，留下对他真正重要的两个：
每个人现在都得是 IC（builder / operator）；
必须有"直接负责的个人(directly responsible individual)" 才能把事情推动完成——是一个具名的人，不是委员会、不是一群人，就是单独一个人。
他相信可以有效地"以 IC 为基础"来构建公司，中层管理"就是结束了"。

"我认为中层管理已经完了。" —— Tom Blomfield

落地第一招：让全公司"对 AI 可读"——录下一切，再 diarize 成面包屑

核心论点：自我改进的前提是"可读性(legibility)"——没被记录的，对 AI 就等于没发生；但海量记录必须经 diarize 合成后才能用。

最重要的一条：把整个组织变得"对 AI 可读"，意味着记录一切。YC 近 3-4 个月开始这么做——你给 YC partner 发的邮件都进 YC 数据库，每条 Slack、每条 DM、每次 office hour 都开始录音。
现场自嘲式的例证：Tom 说他刚跟几位创始人聊得很好，但每场对话都在想"我得把这段录下来"——有人请他引荐某人，他答应了、让对方会后发邮件提醒，"因为我要跟 20 个人聊，肯定会忘"。所以载体得是麦克风、夹子、智能眼镜，或者干脆给每个房间都装上麦。
但不能把 10 万小时录音直接塞进 context window——要像 Garry 讲的那样做 diarization（说话人分离），把它聚合、合成成重点，再给 AI"面包屑(breadcrumbs)"。
User Manual 案例（完整叙事弧）：YC 的新手手册大部分是 5-10 年前写的、已经过时。Harj 上周末想到：既然手上已有近 3 个月、约 2,000 小时的 office hour 录音，何不重新生成手册？做法是给一套指令、把录音 diarize 下来、按融资/招聘/联合创始人纠纷等类别归纳，然后"给我写一份新手册"。一个周末结束，他拿到一份 150 页的新手册，远胜旧版，而且能每月更新——手册由此变成"自我改进的、永远最新的活大脑"。再把它作为 context 喂进 AI agent，你就能向一个超级智能提问，"一次性得到 16 位 YC partner 合并起来的智慧"——但前提是它"可读"。

"如果它被记录了，它就对 AI 发生过；如果没被记录，它就对你的智能没发生过。" —— Tom Blomfield

落地第二、三招：能自我改进才"可读"；软件即用即抛，数据珍藏

核心论点：判断一个产物是否值得保留，看它能否自我改进；价值沉淀在数据与 skills，上层软件是 ephemeral 的、可随模型变强而重生成。

第二招：如果一个产物能自我改进，它就是"可读"的；如果不能，就扔掉。
第三招：每个职能都能"按需生成软件"——这一条原本写的是"dashboard"，但不止 dashboard。Tom 说 Codex（代码 agent，他口中的最新版本）已经强到能把大多数简单的内部软件、dashboard"一次成型(one-shot)"到相当高的质量，他上周末拿 YC 的一堆东西试过，"简直不真实"。
因此所有内部运营团队都应坐在这层"智能理解"之上，自己生成 dashboard 和工作流，并把这些软件视为完全可抛弃的。
与之相对，要极其珍惜地保存所有数据——像 Garry 那样把所有邮件存成 markdown，"什么都别丢"；但软件当成短暂的，可以生成、可以重新生成。
价值在哪：业务 context 与 skills（"这个职能怎么运转""我们怎么办一场 YC 活动"这种沉淀在人脑里的理解）才是有价值的部分；跑活动用的软件可以为这次活动现生成、用完就扔，等一两个月模型更聪明了，把软件丢掉、拿原始指令重新生成。

"把数据像珍宝一样存起来，永远别丢；但把软件当成短暂的——可以生成、可以重生成。" —— Tom Blomfield

人的角色：站在"公司大脑"的边缘，与现实接触

核心论点：数据/skills/know-how 构成中间的"公司大脑"，人退到边缘，只在模型还触及不到的地方出场。

这其实是在讲一个"公司大脑(company brain)"——所有数据、邮件、DM、skills、know-how 是中间那块大脑；而人坐在它的边缘，与真实世界对接，"是智能与现实发生接触的地方"。
人要伸进模型暂时还去不了的地方：Tom 自己边想边举例——电话他觉得 AI 现在已经能轻松接管了；真正属于人的，是新情境、伦理考量、高风险时刻，比如创始人来找他、正在考虑和联合创始人"分手"那种高风险高情绪的时刻。
对在场的创业者而言：销售对话"在未来 20 年里仍然需要一个真人在场"。

"人类伸进模型还去不了的地方……那些高风险、高情绪的时刻，你真的会想要一个活生生的人。" —— Tom Blomfield

收尾：如果今天从零建公司，你会用这个形态吗？

核心论点：自我改进的公司还没人在每个职能上真正做到，但小公司没有借口不从一开始就这样搭。

Tom 坦承这是"梦想"，而且"大家现在都在最前沿摸索边界"——"我不确定有谁已经拥有一家在每个职能上都真正自我改进的公司，我可能错了，你们也许能证明我错。"
他把演讲收束到一个问题留给现场的创始人："如果你今天才开始建你的公司，你会以这个形态来建吗？"
"你们大多数人公司还足够小，可以一开始就建对——所以我不觉得你们有任何借口。"他也知道现场有少数人正在"推倒重建"自己的公司。

附录：关键人 / 概念 / 数据

项目	详情
Tom Blomfield	演讲人，YC General Partner，Monzo / GoCardless 创始人
Garry Tan	YC CEO；"skills + code"、diarization、把邮件存 markdown、相关博客文章
Diana Hu	YC GP，本演讲部分基于她的一个 talk
Jack Dorsey	其推特观点被引用；提出 3 个角色，Tom 删去第三个只留 2 个
Harj Taggar	YC GP，用约 2,000 小时录音一个周末重生成 150 页 user manual
递归自我改进 AI 循环	公司新范式：sensor→policy→tool→quality gate→learning，闭环自我改进
Legibility（可读性）	核心判据：知识/产物能否被 AI 读取并自我改进；"没记录=没发生"
Diarization	说话人分离 + 聚合合成，把海量录音变成可喂给 AI 的"面包屑"
Codex	代码 agent（演讲称最新版），强到能 one-shot 多数内部软件/dashboard
5x	公司在 demo day 的人均收入比 18 个月前高约 5 倍
20~30%	"agent 当副手"带来的提效（被 Tom 视为旧范式，远不及自我改进）
~2,000 小时 / 150 页	近 3 个月 office hour 录音量 / 由此重生成的新手册页数
16	喂进 AI 后可一次性获得的 YC partner 合并智慧的人数
DRI（具名负责人）	推动事情完成必须有的单一具名个人，非委员会