概要
- 核心命题:别再把 AI 当成"给工程师提效 20%"的工具,而要把整个公司重新想象成一组"递归自我改进的 AI 循环"(recursive self-improving AI loops)。 做到这一步,公司"连你睡觉时都在自我变好"。
- 今天的公司是"罗马军团"——靠嵌套层级、一致管理跨度、具名个人来上传下达信息,人是信息流动的管道。Tom 认为 AI 从根本上打破了"层级制是组织经济价值单元的正确方式"这个底层假设。
- 真正的"aha moment"是自我改进,而非提效。 YC 给查询 agent 加了一个"监控 agent":它盯着每个员工的每次查询,发现查询失败时自动追问"为什么失败、缺什么工具",然后隔夜写代码、向 YC 代码库提 merge request、由另一个 agent review 并合并部署——次日同样的查询就能成功。这不是 +20%,是系统自己把自己改好了。
- 两个组织含义:① "烧 token,不是烧 headcount" ——YC 看到公司在 demo day 的人均收入比 18 个月前高约 5 倍,未来瓶颈是 token 用量而非人头;② 中层管理终结——协调问题交给 AI,人人都做 IC(builder/operator),但每件事都需要一个"具名负责人(DRI)",是单个人而非委员会。
- 落地三招:让全公司"对 AI 可读(legible)"。 录下一切("没被记录,对你的 AI 就等于没发生过")、把海量录音 diarize 后合成成"面包屑"喂给 AI;珍藏所有原始数据、把上层软件当成即用即抛(ephemeral)、模型变强就重新生成;人则退到"公司大脑"的边缘,只在新情境、伦理、高风险时刻和销售对话里出场。
公司是"罗马军团",而 AI 打破了层级制的底层假设
核心论点:今天绝大多数公司仍按罗马军团的方式组织——人是信息上传下达的管道;AI 从根本上让这种结构不再必要。
- 罗马军团的设计是"把权力从罗马中心投射到两个大洲之外"——比如远到苏格兰哈德良长城上的戍卒,靠的是嵌套层级、一致的管理跨度、以及具名个人逐级传令和回传信息。
- Tom 引用 Jack Dorsey 几周前的推特:现代公司默认"层级化组织"就是组织经济价值单元的正确方式——而他认为"AI 基本上打破了这一点"。
- 这场演讲本身是"二手智慧"的坦诚组合:Tom 说它部分基于 Diana Hu 的一个 talk,又"偷"了 Jack Dorsey 的一堆想法拼到一起,定位为"相当概念化、高层次"的公司构建思考。
"如果你想想今天大多数公司,它们的组织方式就像罗马军团——人类是信息上下流动的管道。" —— Tom Blomfield
Copilot 是错误的心智模型:那只是给旧工作方式装个更强的引擎
核心论点:把 AI 理解成"提效工具"是一种被破坏的思维方式;正确的做法是重新想象公司是什么、如何运转。
- 一年前人们谈 AI 的用处,都在谈生产力:copilot 让工程师效率提升 20%、把 copilot 塞进工作流、多发布点软件。
- Tom 引用 Garry Tan 的一篇博客来反驳:那等于"拿旧的工作方式,给它装上一个更强力的引擎"——形没变,只是更快。
- 他给出一个极具冲击力的判断:随着模型变强,他"真心相信 AI 能产出比一整个工程团队更多的代码"。真正打动他的,是另一件事——把公司里的领域知识抽取出来、定义成 context 或一组 skills。
- 这些 know-how 散落在人的脑子里、Slack 消息里、邮件里、Notion 里,合在一起定义了"你的公司如何运转"。一旦把它变得"可读(legible)",公司就能从层级组织跃迁为"AI 原生软件驱动的智能组织"。
"AI 不是你焊在公司侧面的东西,不是发给工程师让他们更高效的工具——你可以把公司重新想象成一组递归自我改进的 AI 循环。" —— Tom Blomfield
自我改进循环的五层结构
核心论点:把公司的每个部分都拆成一个能闭环运转的 AI 循环;只要每一步都能在最少人工介入下跑通,系统就会越来越好。
- 传感层(sensor layer):"听起来很花哨,其实就是"——客户邮件、support 工单、代码变更、用户退订、产品遥测,即从外部世界获取信息的数据。
- 策略/决策层(policy layer):规则——什么能做、什么必须先问人类许可、什么必须记录在案。
- 工具层(tool layer):即 Garry 所说的 skills 和 code,本质是确定性 API(如"查我的数据库""看我的日历"),一组 AI 可以调用的工具。
- 质量门(quality gate):evals、确定性检查、安全过滤器、高风险事项的人工审核。
- 学习机制(learning mechanism):系统与真实世界交互,捕捉哪里没跑通,再回流到顶层重新开始。
- 关键判断:如果这每一步都能在最少人工介入下完成,"系统就会越来越好、越来越好——就在你睡觉的时候"。
"Aha moment":监控 agent 让查询系统隔夜自我修复
核心论点:从"agent 当副手(+20~30%)"到"系统自我改进"的跃迁,是加了一个监控层——它发现失败、并自动修好底层能力。
- 起点(去年的版本):YC 先做了一个能查数据库的 agent,很简单,比如问"我上次跟这家公司开 office hour 是什么时候?"。后来更聪明了一点:为正在开 office hour 的公司,用不同方式查库 + RAG,给你找出 5 个 petrochemicals(石化)领域相关的创始人来引荐。Tom 强调——这仍然只是个"副手(sidekick)",让他作为 group partner 高效 20~30%。
- 转折(aha moment):他们在上面加了一个监控 agent,盯着每一个 YC 员工的每一次查询,记录它什么时候奏效、什么时候失败。
- 当查询失败时,监控 agent 会自问:"为什么不行?怎样才能让这条查询成功?是要不同的确定性工具吗?要更新 skills 文件吗?要换个数据库吗?要建新索引吗?"
- 结果:这一切现在"字面意义上隔夜就发生"——写好代码、向 YC 代码库提交 merge request、由一个 agent 来 review、合并、部署。等第二天人类来问同样的查询,它就成功了。
- 判断:这不是 AI 让你多值 20~30%,而是 AI 自己走完整个循环、想清楚怎么自我改进。只要能识别出公司里像这样运转的部分、把人尽量退到监控/监督的位置,"你就可以朝这个问题猛砸 token,公司会自动变好"。
"对我来说那就是那种'卧槽'的时刻——不是 AI 让你多值 20% 或 30%,而是 AI 走完这个循环、自己想明白如何自我改进。" —— Tom Blomfield
更多可自我优化的循环:产品与客服
核心论点:同一套循环可复制到产品优化和客服上,让人退到只做"判断调用"的监督位置。
- 产品自优化循环:让一个 agent 翻你的产品分析,找出销售漏斗里摩擦最高的环节,研究最佳实践,上线一个 AB 测试,跑一周,挑出最优版本并部署——然后对产品一遍又一遍地重复。
- 客服循环:客户建议持续涌入,由一个扮演"首席产品官 + 首席技术官"的 agent 做判断调用——"这条建议我们不想做,丢弃;那条符合路线图,隔夜就写代码、部署、发布给客户",全程无需人类参与。
含义一:烧 token,不是烧 headcount
核心论点:未来公司的约束是 token 用量而非人头;衡量谁在"token-maxing"是判断该把时间花在哪些人身上的粗略但方向正确的信号。
- YC 看到公司"以比 18 个月前高约 5 倍的人均收入(revenue per employee)走到 demo day",并预计这一趋势会延续到 A 轮、B 轮——"很快你会被 token 用量约束,而不是被人头约束"。
- 现在阶段的关键是"探索这玩意儿到底能做什么",所以每个人都该把实验做到极限。
- 粗暴的衡量办法就是测每个人的 token 用量——Tom 直言"极端来看这显然很蠢、也能被博弈",一旦变成排行榜、据此晋升或解雇就一定会被钻空子;但方向上,搞清楚组织里谁在 token-maxing、谁没有,是判断"该和哪些员工一起花时间"的好办法。
"烧 token,别烧人头。" —— Tom Blomfield
含义二:中层管理终结,人人是 IC + 具名负责人
核心论点:协调问题该交给 AI,中层管理已经结束;组织只需要两类角色——人人是 IC,加上对每件事负责的"具名个人"。
- "我就是不认为这个协调问题还需要中层管理,AI 应该来做这件事。"
- Tom 说 Jack Dorsey 提了三个角色,"我不喜欢第三个,所以把它删了",留下对他真正重要的两个:
- 每个人现在都得是 IC(builder / operator);
- 必须有"直接负责的个人(directly responsible individual)" 才能把事情推动完成——是一个具名的人,不是委员会、不是一群人,就是单独一个人。
- 他相信可以有效地"以 IC 为基础"来构建公司,中层管理"就是结束了"。
"我认为中层管理已经完了。" —— Tom Blomfield
落地第一招:让全公司"对 AI 可读"——录下一切,再 diarize 成面包屑
核心论点:自我改进的前提是"可读性(legibility)"——没被记录的,对 AI 就等于没发生;但海量记录必须经 diarize 合成后才能用。
- 最重要的一条:把整个组织变得"对 AI 可读",意味着记录一切。YC 近 3-4 个月开始这么做——你给 YC partner 发的邮件都进 YC 数据库,每条 Slack、每条 DM、每次 office hour 都开始录音。
- 现场自嘲式的例证:Tom 说他刚跟几位创始人聊得很好,但每场对话都在想"我得把这段录下来"——有人请他引荐某人,他答应了、让对方会后发邮件提醒,"因为我要跟 20 个人聊,肯定会忘"。所以载体得是麦克风、夹子、智能眼镜,或者干脆给每个房间都装上麦。
- 但不能把 10 万小时录音直接塞进 context window——要像 Garry 讲的那样做 diarization(说话人分离),把它聚合、合成成重点,再给 AI"面包屑(breadcrumbs)"。
- User Manual 案例(完整叙事弧):YC 的新手手册大部分是 5-10 年前写的、已经过时。Harj 上周末想到:既然手上已有近 3 个月、约 2,000 小时的 office hour 录音,何不重新生成手册?做法是给一套指令、把录音 diarize 下来、按融资/招聘/联合创始人纠纷等类别归纳,然后"给我写一份新手册"。一个周末结束,他拿到一份 150 页的新手册,远胜旧版,而且能每月更新——手册由此变成"自我改进的、永远最新的活大脑"。再把它作为 context 喂进 AI agent,你就能向一个超级智能提问,"一次性得到 16 位 YC partner 合并起来的智慧"——但前提是它"可读"。
"如果它被记录了,它就对 AI 发生过;如果没被记录,它就对你的智能没发生过。" —— Tom Blomfield
落地第二、三招:能自我改进才"可读";软件即用即抛,数据珍藏
核心论点:判断一个产物是否值得保留,看它能否自我改进;价值沉淀在数据与 skills,上层软件是 ephemeral 的、可随模型变强而重生成。
- 第二招:如果一个产物能自我改进,它就是"可读"的;如果不能,就扔掉。
- 第三招:每个职能都能"按需生成软件"——这一条原本写的是"dashboard",但不止 dashboard。Tom 说 Codex(代码 agent,他口中的最新版本)已经强到能把大多数简单的内部软件、dashboard"一次成型(one-shot)"到相当高的质量,他上周末拿 YC 的一堆东西试过,"简直不真实"。
- 因此所有内部运营团队都应坐在这层"智能理解"之上,自己生成 dashboard 和工作流,并把这些软件视为完全可抛弃的。
- 与之相对,要极其珍惜地保存所有数据——像 Garry 那样把所有邮件存成 markdown,"什么都别丢";但软件当成短暂的,可以生成、可以重新生成。
- 价值在哪:业务 context 与 skills("这个职能怎么运转""我们怎么办一场 YC 活动"这种沉淀在人脑里的理解)才是有价值的部分;跑活动用的软件可以为这次活动现生成、用完就扔,等一两个月模型更聪明了,把软件丢掉、拿原始指令重新生成。
"把数据像珍宝一样存起来,永远别丢;但把软件当成短暂的——可以生成、可以重生成。" —— Tom Blomfield
人的角色:站在"公司大脑"的边缘,与现实接触
核心论点:数据/skills/know-how 构成中间的"公司大脑",人退到边缘,只在模型还触及不到的地方出场。
- 这其实是在讲一个"公司大脑(company brain)"——所有数据、邮件、DM、skills、know-how 是中间那块大脑;而人坐在它的边缘,与真实世界对接,"是智能与现实发生接触的地方"。
- 人要伸进模型暂时还去不了的地方:Tom 自己边想边举例——电话他觉得 AI 现在已经能轻松接管了;真正属于人的,是新情境、伦理考量、高风险时刻,比如创始人来找他、正在考虑和联合创始人"分手"那种高风险高情绪的时刻。
- 对在场的创业者而言:销售对话"在未来 20 年里仍然需要一个真人在场"。
"人类伸进模型还去不了的地方……那些高风险、高情绪的时刻,你真的会想要一个活生生的人。" —— Tom Blomfield
收尾:如果今天从零建公司,你会用这个形态吗?
核心论点:自我改进的公司还没人在每个职能上真正做到,但小公司没有借口不从一开始就这样搭。
- Tom 坦承这是"梦想",而且"大家现在都在最前沿摸索边界"——"我不确定有谁已经拥有一家在每个职能上都真正自我改进的公司,我可能错了,你们也许能证明我错。"
- 他把演讲收束到一个问题留给现场的创始人:"如果你今天才开始建你的公司,你会以这个形态来建吗?"
- "你们大多数人公司还足够小,可以一开始就建对——所以我不觉得你们有任何借口。"他也知道现场有少数人正在"推倒重建"自己的公司。
附录:关键人 / 概念 / 数据
| 项目 | 详情 |
|---|---|
| Tom Blomfield | 演讲人,YC General Partner,Monzo / GoCardless 创始人 |
| Garry Tan | YC CEO;"skills + code"、diarization、把邮件存 markdown、相关博客文章 |
| Diana Hu | YC GP,本演讲部分基于她的一个 talk |
| Jack Dorsey | 其推特观点被引用;提出 3 个角色,Tom 删去第三个只留 2 个 |
| Harj Taggar | YC GP,用约 2,000 小时录音一个周末重生成 150 页 user manual |
| 递归自我改进 AI 循环 | 公司新范式:sensor→policy→tool→quality gate→learning,闭环自我改进 |
| Legibility(可读性) | 核心判据:知识/产物能否被 AI 读取并自我改进;"没记录=没发生" |
| Diarization | 说话人分离 + 聚合合成,把海量录音变成可喂给 AI 的"面包屑" |
| Codex | 代码 agent(演讲称最新版),强到能 one-shot 多数内部软件/dashboard |
| 5x | 公司在 demo day 的人均收入比 18 个月前高约 5 倍 |
| 20~30% | "agent 当副手"带来的提效(被 Tom 视为旧范式,远不及自我改进) |
| ~2,000 小时 / 150 页 | 近 3 个月 office hour 录音量 / 由此重生成的新手册页数 |
| 16 | 喂进 AI 后可一次性获得的 YC partner 合并智慧的人数 |
| DRI(具名负责人) | 推动事情完成必须有的单一具名个人,非委员会 |