Google DeepMind's Logan Kilpatrick: Why the Model Eats the Harness

节目

Sequoia Capital

嘉宾

Logan Kilpatrick

日期

2026-06

时长

51 min

查看原始内容 →

概要

Antigravity 取代 Gemini，成为贯穿全 Google 的新"through line"。 过去把 50 个 Google 产品串起来的是 Gemini 这个语言模型；现在串起来的是 Antigravity 这套 agent harness——同一套 harness 正在驱动 search、Gemini app、cloud 和 AI Studio 的 agentic 能力，coding 只是它最成熟的特化场景。
Google 的成功不再以"眼球时间"衡量，而是"客户产出"。 Logan 引述 Demis 的判断：建技术的目的就是让它替你做事，所以 Google 会走"最大化客户完成想做之事"而非"最大化盯着产品的时长"的路线。即便 agent 替你回邮件会减少人类眼球小时，他认为这对 search 反而是正和的——人类搜得更多，agent 也在搜。
核心论点"模型吃掉脚手架"（the model eats the harness）：自建 harness 的护城河会在 12 个月内消失。 两年前"模型"只是一组权重（tokens in / tokens out），如今是围绕权重的一整套庞大系统。脚手架总是领先模型几步，然后被模型"消化"成原生能力；Logan 预测今天意义上自建 harness 的 alpha 一年内就会转移到别处。
coding 是唯一真正跑通的 agent，且已接近"窄域超智能"。 开发者目前在 Claude 和 Codex 间约 50/50，少用 Gemini；Logan 坦承这个观察"不无道理"，并解释 Windsurf 那批人来做 Antigravity 正是为补上"长程套件工作"的产品引擎。他预计今年 coding 之外的 agent 用例也会大幅变好，未来世界是"锯齿状超智能"——先得到一堆垂直超智能，再到 AGI。
应用层不会被吃光，反而机会更多——前提是聚焦。 Logan 反复回到一条主线：模型公司在解通用问题、产品越多越无法聚焦，而"聚焦是创业公司的超能力"。在有领域专长的垂直赛道，创业公司能跑赢最好的模型实验室；coding 又帮小公司抹平了与大公司既有代码库的差距。
贯穿全场的线索是"通用 vs 聚焦"的张力： 模型在吞掉脚手架、走向通用全能（Omni 单模型、harness 被原生化、narrow super intelligence），而价值的另一极始终在聚焦——无论是创业公司靠垂直专长跑赢，还是 Google 因"必须做很多事"而无法聚焦的自我定位，Logan 的每个判断都在这条轴上取位置。

Antigravity 成为新 through line：从"模型串联 Google"到"harness 串联 Google"

核心论点：Sundar 在 IO 称这是"Agentic Gemini 时代"，而把整个 Google 重新连起来的不再是 Gemini 模型，而是 Antigravity 这套 agent harness。

历史脉络：Gemini 之前，Google 约 50 个产品之间其实没有 through line；Gemini 出现后成为"一切产品都以某种方式用到它"的主线。现在这件事正在 Antigravity 上重演——所有产品 rebase 成 agentic-native、能代用户采取行动。
Antigravity 不是单一 IDE，而是一个生态：核心 IDE + web 上的 agent-first 体验 + CLI + SDK，设计原则是"在开发者所在的任何地方接住他"。你也可以直接通过 Gemini API 用一个托管 agent，不必自己做基础设施。
最关键的一点：同一套 harness 不只服务 Antigravity 自己，还在驱动 search、Gemini app、cloud、AI Studio 里的一堆 agent 能力——这才是新的 through line。
Logan 承认 Gemini 2.0 时期（约一年多前）就提过这些苗头，"但有点早"；到了 Gemini 3.5 这一代才真正落地成真。

"历史上 Gemini 之前，我们那么多 Google 产品其实没有一条贯穿线。Gemini 成了那条线，现在 Antigravity 也正在成为那条线。" —— Logan Kilpatrick

agent harness vs coding harness：80% 通用底座 + 20% 场景特化

核心论点：coding 不是一种独立的 harness，而是通用 agent harness 的一个特化用例——但反过来，coding 恰恰成了"通用 agent harness"本身。

两者有 nuance：存在可通过"特化"挤出的优化空间。AI Studio 用的 harness 为 vibe coding 场景特化，Gemini app 用的则为"消费级 24×7 always-on agent"特化。
结构上是"一个 base harness（约 80% 相同）+ 针对 coding 或具体用例的 20% 特化"。
一个反直觉的结论：coding 虽是特化用例，却被证明是"通用 agent harness"——它在 coding 之外也表现极好，于是成了通用底座本身。

自我蚕食担忧：最大化"客户产出"，不是"眼球时间"

核心论点：面对"agent 替你做事会不会减少人类眼球小时、蚕食现有业务"的尖锐提问，Logan 用 Demis 的产品哲学接招——成功 ≠ 最大化盯屏时间，而是最大化客户产出。

Sonya 抛出的具体场景很锋利：如果只是 search / 摘要，蚕食担忧不大；但如果 agent 替你读邮件、替你回邮件，"我还会去翻我的邮箱吗？"——结果就是产品上的人类眼球小时变少。
Logan 的反例：AI era 之初所有人都以为"AI 能替你回答问题"对 search 是负和的，实际却是极其正和——人们搜得更多、做得更多，agent 也在搜，同时催生出一整个新市场。
他承认人类时间总量有限，未来 1–2 年人类行为走向"相对清晰"，3–5 年则不清晰；但从早期体感看，从生态价值创造角度这是非常正和的。
落到战略：引述与 Demis 的反复对话——建技术就是为了它能替你做事，Google 的成功"大概不长成最大化用户盯着我们产品的时间"，而是最大化客户产出，好让他们去过自己的生活。所以你会看到 Google 走"最大化客户产出、而非最大化眼球"的路线。
Sonya 提出"agent growth"这个她脑中挥之不去的词：她自己大量用 coding agent，且"让 agent 替我做所有基础设施选择，我不在乎你用哪个数据库（I don't care which database）"。Logan 顺势推演这会蔓延到购物等场景，并把它和 SEO→GEO（generative engine optimization，生成引擎优化）的演化类比——他猜整体变化会比现在想象的更不激进，因为这些东西彼此叠加复利。

"对 Google 来说，成功大概不长成最大化用户盯着我们产品的时间，而是最大化客户的产出——让他们去做真正想做的事，然后过自己的生活。" —— Logan Kilpatrick

Agent 成熟度：Google 多数产品还在"爬"，Gemini app 和 Antigravity 接近"走/跑"

核心论点：用 crawl/walk/run（爬/走/跑）给 Google 全家桶的 agentic 程度打分，绝大多数产品还在"爬"——这是 13 亿用户级产品的克制，不是能力不足。

大多数产品体验"明显更接近爬行"。原因是 Google 有十多个 13 亿+（13 billion+）用户级产品，对这么大规模用户的产品有 stewardship（受托管理）责任——长尾用户还没准备好让 AI 全自动跑，他们想坐在驾驶座上，谨慎地迈第一步。
search 是这种克制的最典型例子：它有责任以"带着用户一起走、不彻底改变人们与互联网的互动方式"的方式推进。
最接近"走"的是 Gemini app：Spark 这样的 247 always-on agent 会代你执行一堆动作，是前沿用例之一。
Antigravity 也接近"跑"：可以有自主 coding agent 替你重建操作系统、烧掉数十亿 token、花掉数千美元。GDM 在这两件事上都取"前沿视角"，而 Google 其余产品更多是"渐进到达"。
延伸的战略悬念：Google 最终会收敛成 1–3 个 AI 产品界面，还是上万个？Logan 倾向后者——人类消费产品时喜欢"分隔化/专门化"，通用产品反而要用户花更多心力。他举例"我点日历 app，它就只给我看日历，不用操心别的"，并补充这正是 slide deck（幻灯片）存在这么久的原因：你要的那条信息永远在同一个位置；生成式界面听起来很酷，但可能只是更多认知负担。

"如果你做出一个什么都替你干的产品，用这个版本其实要花更多力气。长尾用户反而得花更多脑力和时间，才能让这个通用产品做成他们真正想做的事。" —— Logan Kilpatrick

coding 战局：开发者为何用 Claude/Codex 多于 Gemini

核心论点：面对"我开发者朋友约 50/50 用 Claude 和 Codex、几乎没人用 Gemini"的硬问题，Logan 不回避，并把它放进一条"叙事变得有多快"的元提醒里。

他先补一层让故事更有意思的 context：去年 12 月的叙事是"Google 赢了"——Gemini 3 落地时是模型能力上极其深刻的飞跃，叙事一度是"Google 大幅领先"。
但叙事下一阵风很快转向假期到 1 月之间爆发的 agentic coding；"那其实没过去多久"。Sonya 接话"从那以后就一直是 warp speed（曲速）"，Logan 称这是"事情能变多快"的元提醒。
一个关键产品教训：如果你没有一个真正做"长程套件工作"的产品，就很难为开发者做出一个好的 coding 模型。Google 意识到这点，正是 Windsurf 那笔交易发生、那批人过来最终做出 Antigravity 的原因。Sundar 在 IO 展示了 Google 内部 token 消耗增长的曲线——你需要那台引擎转起来，而"引擎正在转"，但要把模型做出来需要时间。
他把内部 coding 团队称为"AI 的复仇者联盟（the Avengers of AI）"，是 Google 内部最好的一批人在认真推这块石头上山。
3.5 Flash 是信号：抛开价格争议，它在 coding 上比 Google 之前发布过的任何 pro 模型都好——而且是纯 post-training（后训练）收益，是对团队的巨大褒奖。
还有个被外界忽略的线索：预训练窗口/大 run 的时机。从外部看你可能"在某方面落后很多"，但你看不到大预训练 run 的位置；而预训练历来是 DeepMind 的巨大强项，有世界上最好的一批人。

"我在内部把做 code 的这群人形容成'AI 的复仇者联盟'——是 Google 内部最好的一些人在把这块石头往山上推。" —— Logan Kilpatrick

dogfooding 与软起飞：10 万工程师的反馈飞轮

核心论点：DeepMind 鼓励员工用别家模型保持生态感知，但 Gemini 必须是 daily driver——10 万+ 工程师的反馈飞轮是 Google 的结构性竞争优势。

关于"DeepMind 员工还能不能用别家模型"：Logan 说用别家"非常健康"，因为不用就很难真正 grok 生态在发生什么；他自己所有模型、所有产品都用。但你一定得用 Gemini 模型——从反馈飞轮角度极好。
量级：DeepMind 乃至整个 Google 有 10 万+（100,000 plus）顶尖工程师在用模型、给反馈，还能跑 AB test 和线上实验——这种工程规模和人才深度应当成为 Google 的竞争优势。对绝大多数人，Gemini 是 daily driver。
关于"软起飞（soft takeoff）/自我强化循环"：Sonya 问"一旦有了足够好的 agentic coding 模型，是否会加速研究进度、形成自我强化"。Logan 说"这看起来显然成立，但也许我 Kool-Aid 喝多了"。
信号还很早：从模型角度做这件事仍早，因为大训练 run 的资源分配非常重，仍需要"人在驾驶座"做决策——你不会不小心调用 1 万个 TPU 去跑一个没什么意义的任务。
但产品角度已经实打实看到：他们团队用 Antigravity 造移动 app，上线速度比 Google 任何团队都快；Josh 的团队用它端到端交付了 Gemini 的 macOS app，比 Google 任何团队交付 Mac app 都快——全因 agentic coding。

"你不会不小心拿 1 万个 TPU 去 kick off 一个其实没什么意义的任务——所以这些决策还是有人坐在驾驶座上。" —— Logan Kilpatrick

narrow super intelligence 与"锯齿状超智能"：下一个垂直会是科学、数学、金融

核心论点：coding 现在已经"有点像窄域超智能"了；但通往 AGI 的路不是一条平滑曲线，而是先点亮一堆"锯齿状"的垂直超智能。

Sonya 引用 Logan 过去的说法："如果有个系统能用代码造任何东西，人类无法在同层竞争，那就是 narrow super intelligence。"——问是否已到这一点。
Logan 说 coding 现在确实"有点那种感觉"，好到像窄域超智能；如何量化取决于细节，但关键是它对 code 这件事好用得不可思议、影响巨大。
他刻意让"它对 code 极其好用"这个事实"冲刷自己"：建 AGI 当然重要，但如果建 AGI 的叙事抢走了"当下技术现有能力"的故事，那是糟糕的 trade-off。他始终在脑中并列两件事——既要建通用技术，也要珍惜当下这个东西有多 impactful。
一个让他欣慰的结果：coding 没有取代人类开发者，反而是 accelerant（加速器）。以他个人体感：以前会想"要是能做就好了"然后搁置的略超出能力范围的点子，现在反而有了相反的烦恼——"我大概能把它做得更有野心"，于是不能只做 MVP，得多走 10 步；重置自己的野心水位是他花了很多时间想的事。
他预测会先得到一堆垂直超智能领域，再解决通用——"几乎像锯齿状超智能（jagged super intelligence）"。下一批最可能的垂直是可验证性强的领域：数学、金融，尤其是科学。他认为让这些"对世界正向、有影响力"的好事尽早发生很重要，好让人们理解技术的正面潜力。
现场小插曲：Sonya 提到一条好笑的推——"Erdős 为什么有这么多 problems？"（数学 proof 双关），Logan 笑称这是个好 T 恤梗。

"现在我有了相反的烦恼：以前想着'要是能做就好了'，现在是'我大概能把这件事做得更有野心'——技术逼着我把 MVP 再往前推 10 步。" —— Logan Kilpatrick

Vibe code 视频游戏：模型够了，缺的是产品脚手架

核心论点：去年 10 月 Logan 发推"2025 年底人人能 vibe code 视频游戏"——他的复盘是"feels close"，瓶颈不在模型质量，而在懂游戏的人有没有把脚手架（scaffolding）搭对。

现状判断：不是 AAA 大作（不是下一个 Call of Duty 或 GTA），但"比以往任何时候都更近"。
为什么还差一口气：视频游戏需要很多"模型之外"的东西。3JS 是个好例子——它让很多以前不可能的事成为可能，但仍有一堆 coding agent 解决不了的粗糙边缘，比如 sprite（精灵图）生成模型原生做得不好，需要编排层和工具；还有一堆对可靠性要求高、且需要一点品味的东西，需要大量产品脚手架才能做出可复用、可重玩、有深度的体验。
数据：AI Studio 早期约 20% 的应用是游戏（人们尝试做游戏）；现在游戏已不是最热门类别，因为生态和用户基盘变了。
"rando off the street + 好点子 → vibe code 出一个真正好玩可玩的游戏"还有多远？Logan 想说"今年"——模型能力让它成为可能，gap 不在模型质量，而在"知道做好游戏需要什么的人，把脚手架以正确方式搭起来"。有人正在做，部分是可发现性/认知问题（人们根本不知道自己能做），部分是某些模型能力还差一点点、离跨越那道鸿沟只有数周或数月。
路线判断：vibe code 游戏短期更可能是"game engine + coding agent"而非"world model based"——世界模型的定义会模糊，但其当前开放式本质还不适合做游戏；"coding agent + 某种 game engine"能榨出多得多的 alpha。

"我不觉得这里有模型质量的 gap。gap 在于：一个知道怎么做出好游戏的人，要不要把脚手架以正确方式拼起来。" —— Logan Kilpatrick

世界模型定义在模糊化：Omni 是单一全能模型，不是路由

核心论点：Omni 让"世界模型"的定义模糊化——它不是传统的 action-conditioned video model，而是一个对世界有理解的单一全能模型。

定义之辨：传统世界模型 ≈ action-conditioned video model（动作条件视频模型，如 Genie），非常贵、历来"极其不可扩展"。而现在说"world model"，实际常指"对世界有理解的模型"，而非严格技术意义上的动作条件视频模型。
Demis 在 IO 把 Omni 框定为世界模型是恰当的——因为它对世界的理解程度很高。它在架构上不同于过去的世界模型（Logan 自陈非架构专家），但这种不同是正面的，因为更接近"可能更可扩展"的路径。
模糊点在于：Omni 既有对世界的理解，又能做很多传统世界模型那种用例（视觉创造），虽然现在还不是实时的——同一个模型既理解又能生成，这是最有意思的地方。
工程实现：Omni 是单一模型（single model），这是关键。原始诉求就是不想为每件事训 8 个不同模型——历史上是 baseline Gemini 文本模型 + 音频 + 音乐模型 Lyria + Nano Banana（图像）+ Veo 视频 + 一整套音频模型。Omni 不是路由到一堆模型，而是真正的全能模型。
它从现在最成熟的用例切入——视频编辑能力，所以这是当前唯一开放的能力；技术上对其他能力也 functional，只是质量还不完美、非 SOTA，所以没 roll out。这是 Omni 的第一版"Omni Flash 模型"，后续会有强大得多的版本。

"它不是路由到一堆不同的模型——我们本可以那样做一个 Gemini omni 模型，但这是一个真正的 omni 模型。" —— Logan Kilpatrick

Omni 的"现场加一只狗"：生成媒体该有的样子是"不改我、只改背景"

核心论点：Omni 最打动 Logan 的，是它能改掉"非我"的部分（布景、咖啡桌）却不改"我"（话、声音、形象）——这正是他想要的生成媒体形态：不是一堆 AI avatar，而是真实人格被放大。

完整故事：Logan 在一场演讲中与领导 model team 的朋友 Tulsi 同台。他让台下某人实时编辑视频，对方真的用 Omni 实时把现场图片编辑了一下——一只狗走上台，在编辑版里其他嘉宾低头看到狗、轻轻偷笑（这时 Logan 正在台上大谈 AI），狗跳上他的大腿，他顺势 acknowledge 那只狗、继续讲话、一边摸着它。"把这种微妙拿捏到位有那么多 subtlety，模型却 crush 了它。"——他至今还在消化这对内容创作意味着什么。
个人哲学：Logan 说自己历来不用 AI 做任何他产出的内容——全是他自己的话、声音、形象。"我宁可是我本人，而不是某个 AI 版本的我。"他喜欢 Omni 恰恰因为它不改"我"，只改那些"不是我"的部分——他没挑现场的布景或咖啡桌，所以话可以一字不变，而那些非个人的部分可以被换成更有意思的东西。
Sonya 自陈是"生成媒体最大的多头"，并说他们做播客时"视觉和内容同等重要"——视觉是第一时间抓住注意力的方式。两人调侃这不是"水果岛视频（Fruit Island videos）"那类 AI 内容，而是"原创内容、真实的人、人格仍在，只是被放大、被变得不同"。Sonya 补一句她其实也不介意水果视频，乐见两种世界并存。

"我喜欢 Omni 的点在于它不改我，改的是那些不是我的部分——所以我们的话可以保持不变，而那些不个人的部分可以被换成更有意思的东西。" —— Logan Kilpatrick

AI Studio 里 vibe code Android：一周 35 万个应用

核心论点：AI Studio 让人 vibe code Android 应用，一周内就造了 35 万个——绝大多数是"以前根本没人会去做"的个人问题解决方案。

战略动机：Google 产品太多，用户在创业/把想法变成现实的旅程里会经过各种 Google 入口。AI Studio 有一条"一等原则"——把各种东西引进 AI Studio，让你不必跨 9 个不同 UI 就能接触 Google 生态的其他部分。Android 是个好例子，也让本来不会做 Android 应用的人能做了。
Logan 自陈：他在 AI Studio 里做了人生第一个 Android 应用——不是加密 app，而是个种树/园艺 app（他在后院种树）；还没想到那个让他兴奋的"突破性点子"，但打算想一个去 App Store 竞争。
数据：上次他们今早 review 数字时，自上周以来 AI Studio 里造了约 35 万（350,000）个 Android 应用，"很疯狂"——而且令人兴奋的是这 35 万大概是"以前没人会去做"的应用，很多是个人用途。
判断："用软件解决你的个人问题"现在非常真实，是这些产品最常见的用例之一；能解锁手机的一堆原生能力也很有意思，因为你有那么多分散在不同地方的 context。Android 正在成为"builders 的平台"。
App vs Web：Web 确实强大，但操作系统有些原生丰富度是解锁不了的。Logan 以短信为例——所有主流操作系统里的短信体验都比他用过的任何 AI 聊天 app 更丰富；"如果我能在我用的短信 app 里直接跟 AI 说话，我会比跑去另一个 app 开心得多"，因为我们也被操作系统 conditioned 了。

"上周以来，AI Studio 里造了大约 35 万个 Android 应用——而且这 35 万个，大概以前根本没人会去做。" —— Logan Kilpatrick

模型吃掉脚手架：12 个月后自建 harness 的 alpha 会转移

核心论点：这是全场的标题论点——"模型"早已不只是权重，而是围绕权重不断膨胀的庞大系统；脚手架领先模型几步，然后被模型吃掉、上游化进模型，alpha 随之转移。

历史对照：两年前 LLM 流行时，"模型"就是一组权重——尽可能简单地把 token 送进去、再拿 token 出来。如今我们仍叫它"模型"、仍叫 Gemini 3.5 / GPT / Claude，但它其实早已不只是权重，而是围绕权重构建的一整套不断扩张、蔓延的系统：从 agentic 工具调用，到托管工具（搜索、代码执行等），模型被放进容器、配上 agent harness。
机制：脚手架往往比"直接烤进模型里的东西"领先几步；然后模型把那部分脚手架吃掉，它变成原生模型系统的一部分。某些情况下外部脚手架仍有价值——比如 search，很多人用不同 search 提供商、有不同用例，所以即便模型能原生用 search，你也会想要外部的；code execution 是另一例。
最典型的当下例子就是 agent harness："现在所有人都觉得得去建 harness、alpha 在 harness 里。"Logan 判断这一点"至少以我们今天理解 harness 的方式"在 12 个月内不再成立——模型会消化掉一大块，上游化进模型，alpha 会转移到别处，而不在"自己 spin 一个 harness"上。
对反方观点的回应：Sonya 指出人们自建 harness 是为了不被某个模型商锁定、应用公司要灵活性。Logan 承认这"一开始也许成立"，但随模型能力提升会越来越不成立——"如果一个模型连别的 harness 都用不了，它就不是通用模型"；所以模型最终应当能用上每一种 harness。
由此他提议做一个"harness bench"——衡量各模型适配各种不同 harness 的能力，他觉得这是生态该测的合理东西，也很好奇哪些模型最强。除非你完全 out of distribution，但那种情况下你用自己的 harness 也照样 out of distribution，所以"是否锁定其实没那么重要"。

"12 个月后，至少以我们今天理解 harness 的方式，'alpha 在自建 harness 里'这件事大概不再成立——模型会把它消化掉，原生就能做。" —— Logan Kilpatrick

应用层如何生存：聚焦是创业公司的超能力

核心论点：当模型吃掉 harness 和周边一切，独立公司靠什么活下来？Logan 的答案是——两件事同时为真：机会空前多，且聚焦让创业公司能跑赢最好的模型实验室。

两件看似矛盾的事同时成立：一方面"放眼望去从没有过这么多可建的机会"，另一方面模型确实在做前所未有多的事。中间有几条线索：capability overhang（能力悬置）里有巨大 alpha；模型公司在追"非常通用的问题"，而垂直化领域里价值极大——如果你有领域专长、懂客户、懂生态，你能绕着最好的模型实验室跑圈。
"聚焦是创业公司的超能力——只要能聚焦，你什么都能做成。" 反观所有体量大、做很多事的公司，普遍缺乏聚焦。Logan 半自嘲地"过度合理化 Google 战略"：Google 产品多、用户多、事情多，作为大公司有义务做一堆事，所以无法在单一领域聚焦——这对创业公司不成立。
时间维度的反转：24 个月前大家都在问"机会空间是不是在移位、未来给创业公司的机会会不会变少"；事实上至今"远不是那样"，反而感觉机会比当时更多。coding 帮你抹平了与"有既有代码库的大公司"的差距，让你跑得快得多、写软件更快；agentic primitive 是可围绕其建产品的新品类。
风险即机会：很多情况下建 agentic 产品有风险，不同公司风险偏好不同——如果你愿意在某些领域承担更多风险，你能赢得一群"也愿意冒险"的用户 cohort。"机会太多了。"

"聚焦是创业公司的超能力——只要你能聚焦，你什么都能做成。而所有做很多事的大公司，恰恰都缺少聚焦。" —— Logan Kilpatrick

GDM 文化：组合拳、领导者塑造文化、Google 的"引擎室"

核心论点：Logan 给出对 GDM 文化的三点观察——最强的"组合拳"投资组合、文化由领导者气质渗透、以及 GDM 是"Google 的引擎室"。

身处其中的体感：Demis、回归的 Sergey、回归的 Noam Shazeer……Logan 说"难以置信"，并刻意在混乱中尽量抽身反思这个时刻。
观察一·组合拳与聚焦的代价：GDM 有"最强的 portfolio 之一"，但正因为做很多事，会出现"别的实验室/公司在某个我们投入不足、不够聚焦的领域抢先"的时刻——他很欣赏 Google 追赶补差的方式。他看过几遍 Demis 的"thinking game"纪录片，里面那种"把一群聪明人凑到一起去解决问题"的原始文化与今天高度相似。
观察二·领导者塑造文化：文化从"领导者是谁"渗透出来。Demis 是诺奖科学家、很多事的 OG，你能在 DeepMind 文化里感到这种科学气质；对比之下 Sam 是"也许是世界上最好的商人之一"，你能在 OpenAI 文化里看到这点；Dario 他没有强烈的判断、觉得 Anthropic 很有意思、Dario 像个"有点深奥/esoteric"的人，那种气质也写进了公司 DNA。Logan 偏爱 Demis 这种"非常科学地看世界"的方式，以及"做这件事的初衷是去解决疾病等真实问题"。
观察三·别迷失在数字竞赛里：他最爱的硅谷台词是剧中 Gavin Belson 的"我们不能让别人比我们更能让世界变得更好"——当下整个行业感觉就是大家在争"谁能比对方更让世界变好"，这么一框就显得很 goofy，所以这本质上完全不是零和的。很容易在"谁把 SWE 分数推得更高"的竞赛里迷失，而忘了我们做这些是为了解决人类真正的问题。
观察三续·引擎室：GDM 是"Google 的引擎室（engine room）"——他说这现在就是 DeepMind 推特账号的 bio。一边是深植的实验室文化，一边是与 Android、Google Cloud、Gmail、Workspace 等整个 Google 生态的协作。把 Gemini 部署到十亿用户产品，是"世界上只有两家公司"面对的问题，而 Google 有 13 个这种产品——这种事只有在 Google 内部才做得到。
尾声轻松一笔：Sonya 问当年他加入并大量发推时，coms（公关团队）是不是很头疼、要不要审批。Logan 说这是他 Google 体验的一个 silver lining——marketing/coms 团队极好合作，他不必每条推都被审批，能用对开发者真实、有共鸣的方式讲故事；他也始终在走那条"不烧掉积累的信任与善意"的线。他的判断是：Google 很难讲出这种真实故事，因为公司大、人多、意见多，"你把 Google 的魔力通过一堆人和一堆流程稀释掉"，就会丢掉那个本该很美的故事——Google 在做世界上最有意思的技术、帮用户解决最难的问题。

"我最爱的硅谷台词是 Gavin Belson 那句'我们不能让别人比我们更能让世界变得更好'——当下就是这种感觉，所有人都在争谁能比对方更让世界变好。这么一框，就显得特别傻，所以它完全不是零和的。" —— Logan Kilpatrick

附录：关键人 / 机构 / 产品 / 数据

项目	详情
Logan Kilpatrick	嘉宾，Google DeepMind，负责 Google AI Studio 与 Gemini API
Sonya Huang	访谈者，Sequoia Capital 合伙人，生成式媒体死忠多头
Demis Hassabis	Google DeepMind CEO，诺奖科学家；反复出现的产品哲学来源（"建技术是为了替你做事"）
Tulsi	Logan 的朋友，领导 model team
Josh	同事，其团队用 Antigravity 端到端交付 Gemini macOS app
Sundar Pichai	在 Google IO 称这是"Agentic Gemini 时代"，展示内部 token 消耗增长曲线
Sergey Brin / Noam Shazeer	均已回归 Google DeepMind
Sam Altman / Dario Amodei	被用作"领导者塑造文化"的对比（顶级商人 / 深奥气质）
Antigravity	Google 的 agent harness，含 IDE + web agent + CLI + SDK；驱动 search/Gemini app/cloud/AI Studio
Gemini API / AI Studio	Logan 负责的产品；AI Studio 可 vibe code Android 应用
Omni / Omni Flash	单一全能模型（非路由），从视频编辑能力切入；第一版为 Omni Flash
Genie	传统 action-conditioned video model（世界模型）代表，昂贵、不可扩展
Lyria / Nano Banana / Veo	Omni 之前各自独立的音乐 / 图像 / 视频模型
Gemini 3 / 3.5 Flash	Gemini 3 是模型能力大飞跃；3.5 Flash 纯 post-training 收益，coding 超越此前任何 pro 模型
Windsurf	被 Google 收购，那批人最终做出 Antigravity
3JS	让很多游戏开发成为可能，但 sprite 生成等仍需编排层
harness bench	Logan 提议的新基准：衡量各模型适配不同 harness 的能力
约 50 个 Google 产品	Gemini / Antigravity 是贯穿它们的 through line
13 个 13 亿+ 用户产品	把 Gemini 部署到十亿用户产品是世界上仅两家公司面对的问题
100,000+ 工程师	用 Gemini 给反馈，构成 Google 的反馈飞轮竞争优势
350,000 个 Android 应用	AI Studio 上周以来一周内造出，多为个人用途
AI Studio 应用品类	早期游戏约 20%；现热门为金融约 20%（多与加密相关）、个人生产力、生成媒体
crawl / walk / run	Agent 成熟度分级：Google 多数产品在 crawl，Gemini app / Antigravity 接近 walk/run
narrow / jagged super intelligence	窄域超智能（coding 已接近）/ 锯齿状超智能（先得垂直超智能再到 AGI）
GEO	generative engine optimization，对应 SEO 的生成引擎优化
Gavin Belson	美剧《硅谷》角色，Logan 最爱台词"不能让别人比我们更能让世界变好"的出处
Erdős	数学家梗："why did Erdős have so many problems?"（proof 双关）