概要
- Antigravity 取代 Gemini,成为贯穿全 Google 的新"through line"。 过去把 50 个 Google 产品串起来的是 Gemini 这个语言模型;现在串起来的是 Antigravity 这套 agent harness——同一套 harness 正在驱动 search、Gemini app、cloud 和 AI Studio 的 agentic 能力,coding 只是它最成熟的特化场景。
- Google 的成功不再以"眼球时间"衡量,而是"客户产出"。 Logan 引述 Demis 的判断:建技术的目的就是让它替你做事,所以 Google 会走"最大化客户完成想做之事"而非"最大化盯着产品的时长"的路线。即便 agent 替你回邮件会减少人类眼球小时,他认为这对 search 反而是正和的——人类搜得更多,agent 也在搜。
- 核心论点"模型吃掉脚手架"(the model eats the harness):自建 harness 的护城河会在 12 个月内消失。 两年前"模型"只是一组权重(tokens in / tokens out),如今是围绕权重的一整套庞大系统。脚手架总是领先模型几步,然后被模型"消化"成原生能力;Logan 预测今天意义上自建 harness 的 alpha 一年内就会转移到别处。
- coding 是唯一真正跑通的 agent,且已接近"窄域超智能"。 开发者目前在 Claude 和 Codex 间约 50/50,少用 Gemini;Logan 坦承这个观察"不无道理",并解释 Windsurf 那批人来做 Antigravity 正是为补上"长程套件工作"的产品引擎。他预计今年 coding 之外的 agent 用例也会大幅变好,未来世界是"锯齿状超智能"——先得到一堆垂直超智能,再到 AGI。
- 应用层不会被吃光,反而机会更多——前提是聚焦。 Logan 反复回到一条主线:模型公司在解通用问题、产品越多越无法聚焦,而"聚焦是创业公司的超能力"。在有领域专长的垂直赛道,创业公司能跑赢最好的模型实验室;coding 又帮小公司抹平了与大公司既有代码库的差距。
- 贯穿全场的线索是"通用 vs 聚焦"的张力: 模型在吞掉脚手架、走向通用全能(Omni 单模型、harness 被原生化、narrow super intelligence),而价值的另一极始终在聚焦——无论是创业公司靠垂直专长跑赢,还是 Google 因"必须做很多事"而无法聚焦的自我定位,Logan 的每个判断都在这条轴上取位置。
Antigravity 成为新 through line:从"模型串联 Google"到"harness 串联 Google"
核心论点:Sundar 在 IO 称这是"Agentic Gemini 时代",而把整个 Google 重新连起来的不再是 Gemini 模型,而是 Antigravity 这套 agent harness。
- 历史脉络:Gemini 之前,Google 约 50 个产品之间其实没有 through line;Gemini 出现后成为"一切产品都以某种方式用到它"的主线。现在这件事正在 Antigravity 上重演——所有产品 rebase 成 agentic-native、能代用户采取行动。
- Antigravity 不是单一 IDE,而是一个生态:核心 IDE + web 上的 agent-first 体验 + CLI + SDK,设计原则是"在开发者所在的任何地方接住他"。你也可以直接通过 Gemini API 用一个托管 agent,不必自己做基础设施。
- 最关键的一点:同一套 harness 不只服务 Antigravity 自己,还在驱动 search、Gemini app、cloud、AI Studio 里的一堆 agent 能力——这才是新的 through line。
- Logan 承认 Gemini 2.0 时期(约一年多前)就提过这些苗头,"但有点早";到了 Gemini 3.5 这一代才真正落地成真。
"历史上 Gemini 之前,我们那么多 Google 产品其实没有一条贯穿线。Gemini 成了那条线,现在 Antigravity 也正在成为那条线。" —— Logan Kilpatrick
agent harness vs coding harness:80% 通用底座 + 20% 场景特化
核心论点:coding 不是一种独立的 harness,而是通用 agent harness 的一个特化用例——但反过来,coding 恰恰成了"通用 agent harness"本身。
- 两者有 nuance:存在可通过"特化"挤出的优化空间。AI Studio 用的 harness 为 vibe coding 场景特化,Gemini app 用的则为"消费级 24×7 always-on agent"特化。
- 结构上是"一个 base harness(约 80% 相同)+ 针对 coding 或具体用例的 20% 特化"。
- 一个反直觉的结论:coding 虽是特化用例,却被证明是"通用 agent harness"——它在 coding 之外也表现极好,于是成了通用底座本身。
自我蚕食担忧:最大化"客户产出",不是"眼球时间"
核心论点:面对"agent 替你做事会不会减少人类眼球小时、蚕食现有业务"的尖锐提问,Logan 用 Demis 的产品哲学接招——成功 ≠ 最大化盯屏时间,而是最大化客户产出。
- Sonya 抛出的具体场景很锋利:如果只是 search / 摘要,蚕食担忧不大;但如果 agent 替你读邮件、替你回邮件,"我还会去翻我的邮箱吗?"——结果就是产品上的人类眼球小时变少。
- Logan 的反例:AI era 之初所有人都以为"AI 能替你回答问题"对 search 是负和的,实际却是极其正和——人们搜得更多、做得更多,agent 也在搜,同时催生出一整个新市场。
- 他承认人类时间总量有限,未来 1–2 年人类行为走向"相对清晰",3–5 年则不清晰;但从早期体感看,从生态价值创造角度这是非常正和的。
- 落到战略:引述与 Demis 的反复对话——建技术就是为了它能替你做事,Google 的成功"大概不长成最大化用户盯着我们产品的时间",而是最大化客户产出,好让他们去过自己的生活。所以你会看到 Google 走"最大化客户产出、而非最大化眼球"的路线。
- Sonya 提出"agent growth"这个她脑中挥之不去的词:她自己大量用 coding agent,且"让 agent 替我做所有基础设施选择,我不在乎你用哪个数据库(I don't care which database)"。Logan 顺势推演这会蔓延到购物等场景,并把它和 SEO→GEO(generative engine optimization,生成引擎优化)的演化类比——他猜整体变化会比现在想象的更不激进,因为这些东西彼此叠加复利。
"对 Google 来说,成功大概不长成最大化用户盯着我们产品的时间,而是最大化客户的产出——让他们去做真正想做的事,然后过自己的生活。" —— Logan Kilpatrick
Agent 成熟度:Google 多数产品还在"爬",Gemini app 和 Antigravity 接近"走/跑"
核心论点:用 crawl/walk/run(爬/走/跑)给 Google 全家桶的 agentic 程度打分,绝大多数产品还在"爬"——这是 13 亿用户级产品的克制,不是能力不足。
- 大多数产品体验"明显更接近爬行"。原因是 Google 有十多个 13 亿+(13 billion+)用户级产品,对这么大规模用户的产品有 stewardship(受托管理)责任——长尾用户还没准备好让 AI 全自动跑,他们想坐在驾驶座上,谨慎地迈第一步。
- search 是这种克制的最典型例子:它有责任以"带着用户一起走、不彻底改变人们与互联网的互动方式"的方式推进。
- 最接近"走"的是 Gemini app:Spark 这样的 247 always-on agent 会代你执行一堆动作,是前沿用例之一。
- Antigravity 也接近"跑":可以有自主 coding agent 替你重建操作系统、烧掉数十亿 token、花掉数千美元。GDM 在这两件事上都取"前沿视角",而 Google 其余产品更多是"渐进到达"。
- 延伸的战略悬念:Google 最终会收敛成 1–3 个 AI 产品界面,还是上万个?Logan 倾向后者——人类消费产品时喜欢"分隔化/专门化",通用产品反而要用户花更多心力。他举例"我点日历 app,它就只给我看日历,不用操心别的",并补充这正是 slide deck(幻灯片)存在这么久的原因:你要的那条信息永远在同一个位置;生成式界面听起来很酷,但可能只是更多认知负担。
"如果你做出一个什么都替你干的产品,用这个版本其实要花更多力气。长尾用户反而得花更多脑力和时间,才能让这个通用产品做成他们真正想做的事。" —— Logan Kilpatrick
coding 战局:开发者为何用 Claude/Codex 多于 Gemini
核心论点:面对"我开发者朋友约 50/50 用 Claude 和 Codex、几乎没人用 Gemini"的硬问题,Logan 不回避,并把它放进一条"叙事变得有多快"的元提醒里。
- 他先补一层让故事更有意思的 context:去年 12 月的叙事是"Google 赢了"——Gemini 3 落地时是模型能力上极其深刻的飞跃,叙事一度是"Google 大幅领先"。
- 但叙事下一阵风很快转向假期到 1 月之间爆发的 agentic coding;"那其实没过去多久"。Sonya 接话"从那以后就一直是 warp speed(曲速)",Logan 称这是"事情能变多快"的元提醒。
- 一个关键产品教训:如果你没有一个真正做"长程套件工作"的产品,就很难为开发者做出一个好的 coding 模型。Google 意识到这点,正是 Windsurf 那笔交易发生、那批人过来最终做出 Antigravity 的原因。Sundar 在 IO 展示了 Google 内部 token 消耗增长的曲线——你需要那台引擎转起来,而"引擎正在转",但要把模型做出来需要时间。
- 他把内部 coding 团队称为"AI 的复仇者联盟(the Avengers of AI)",是 Google 内部最好的一批人在认真推这块石头上山。
- 3.5 Flash 是信号:抛开价格争议,它在 coding 上比 Google 之前发布过的任何 pro 模型都好——而且是纯 post-training(后训练)收益,是对团队的巨大褒奖。
- 还有个被外界忽略的线索:预训练窗口/大 run 的时机。从外部看你可能"在某方面落后很多",但你看不到大预训练 run 的位置;而预训练历来是 DeepMind 的巨大强项,有世界上最好的一批人。
"我在内部把做 code 的这群人形容成'AI 的复仇者联盟'——是 Google 内部最好的一些人在把这块石头往山上推。" —— Logan Kilpatrick
dogfooding 与软起飞:10 万工程师的反馈飞轮
核心论点:DeepMind 鼓励员工用别家模型保持生态感知,但 Gemini 必须是 daily driver——10 万+ 工程师的反馈飞轮是 Google 的结构性竞争优势。
- 关于"DeepMind 员工还能不能用别家模型":Logan 说用别家"非常健康",因为不用就很难真正 grok 生态在发生什么;他自己所有模型、所有产品都用。但你一定得用 Gemini 模型——从反馈飞轮角度极好。
- 量级:DeepMind 乃至整个 Google 有 10 万+(100,000 plus)顶尖工程师在用模型、给反馈,还能跑 AB test 和线上实验——这种工程规模和人才深度应当成为 Google 的竞争优势。对绝大多数人,Gemini 是 daily driver。
- 关于"软起飞(soft takeoff)/自我强化循环":Sonya 问"一旦有了足够好的 agentic coding 模型,是否会加速研究进度、形成自我强化"。Logan 说"这看起来显然成立,但也许我 Kool-Aid 喝多了"。
- 信号还很早:从模型角度做这件事仍早,因为大训练 run 的资源分配非常重,仍需要"人在驾驶座"做决策——你不会不小心调用 1 万个 TPU 去跑一个没什么意义的任务。
- 但产品角度已经实打实看到:他们团队用 Antigravity 造移动 app,上线速度比 Google 任何团队都快;Josh 的团队用它端到端交付了 Gemini 的 macOS app,比 Google 任何团队交付 Mac app 都快——全因 agentic coding。
"你不会不小心拿 1 万个 TPU 去 kick off 一个其实没什么意义的任务——所以这些决策还是有人坐在驾驶座上。" —— Logan Kilpatrick
narrow super intelligence 与"锯齿状超智能":下一个垂直会是科学、数学、金融
核心论点:coding 现在已经"有点像窄域超智能"了;但通往 AGI 的路不是一条平滑曲线,而是先点亮一堆"锯齿状"的垂直超智能。
- Sonya 引用 Logan 过去的说法:"如果有个系统能用代码造任何东西,人类无法在同层竞争,那就是 narrow super intelligence。"——问是否已到这一点。
- Logan 说 coding 现在确实"有点那种感觉",好到像窄域超智能;如何量化取决于细节,但关键是它对 code 这件事好用得不可思议、影响巨大。
- 他刻意让"它对 code 极其好用"这个事实"冲刷自己":建 AGI 当然重要,但如果建 AGI 的叙事抢走了"当下技术现有能力"的故事,那是糟糕的 trade-off。他始终在脑中并列两件事——既要建通用技术,也要珍惜当下这个东西有多 impactful。
- 一个让他欣慰的结果:coding 没有取代人类开发者,反而是 accelerant(加速器)。以他个人体感:以前会想"要是能做就好了"然后搁置的略超出能力范围的点子,现在反而有了相反的烦恼——"我大概能把它做得更有野心",于是不能只做 MVP,得多走 10 步;重置自己的野心水位是他花了很多时间想的事。
- 他预测会先得到一堆垂直超智能领域,再解决通用——"几乎像锯齿状超智能(jagged super intelligence)"。下一批最可能的垂直是可验证性强的领域:数学、金融,尤其是科学。他认为让这些"对世界正向、有影响力"的好事尽早发生很重要,好让人们理解技术的正面潜力。
- 现场小插曲:Sonya 提到一条好笑的推——"Erdős 为什么有这么多 problems?"(数学 proof 双关),Logan 笑称这是个好 T 恤梗。
"现在我有了相反的烦恼:以前想着'要是能做就好了',现在是'我大概能把这件事做得更有野心'——技术逼着我把 MVP 再往前推 10 步。" —— Logan Kilpatrick
Vibe code 视频游戏:模型够了,缺的是产品脚手架
核心论点:去年 10 月 Logan 发推"2025 年底人人能 vibe code 视频游戏"——他的复盘是"feels close",瓶颈不在模型质量,而在懂游戏的人有没有把脚手架(scaffolding)搭对。
- 现状判断:不是 AAA 大作(不是下一个 Call of Duty 或 GTA),但"比以往任何时候都更近"。
- 为什么还差一口气:视频游戏需要很多"模型之外"的东西。3JS 是个好例子——它让很多以前不可能的事成为可能,但仍有一堆 coding agent 解决不了的粗糙边缘,比如 sprite(精灵图)生成模型原生做得不好,需要编排层和工具;还有一堆对可靠性要求高、且需要一点品味的东西,需要大量产品脚手架才能做出可复用、可重玩、有深度的体验。
- 数据:AI Studio 早期约 20% 的应用是游戏(人们尝试做游戏);现在游戏已不是最热门类别,因为生态和用户基盘变了。
- "rando off the street + 好点子 → vibe code 出一个真正好玩可玩的游戏"还有多远?Logan 想说"今年"——模型能力让它成为可能,gap 不在模型质量,而在"知道做好游戏需要什么的人,把脚手架以正确方式搭起来"。有人正在做,部分是可发现性/认知问题(人们根本不知道自己能做),部分是某些模型能力还差一点点、离跨越那道鸿沟只有数周或数月。
- 路线判断:vibe code 游戏短期更可能是"game engine + coding agent"而非"world model based"——世界模型的定义会模糊,但其当前开放式本质还不适合做游戏;"coding agent + 某种 game engine"能榨出多得多的 alpha。
"我不觉得这里有模型质量的 gap。gap 在于:一个知道怎么做出好游戏的人,要不要把脚手架以正确方式拼起来。" —— Logan Kilpatrick
世界模型定义在模糊化:Omni 是单一全能模型,不是路由
核心论点:Omni 让"世界模型"的定义模糊化——它不是传统的 action-conditioned video model,而是一个对世界有理解的单一全能模型。
- 定义之辨:传统世界模型 ≈ action-conditioned video model(动作条件视频模型,如 Genie),非常贵、历来"极其不可扩展"。而现在说"world model",实际常指"对世界有理解的模型",而非严格技术意义上的动作条件视频模型。
- Demis 在 IO 把 Omni 框定为世界模型是恰当的——因为它对世界的理解程度很高。它在架构上不同于过去的世界模型(Logan 自陈非架构专家),但这种不同是正面的,因为更接近"可能更可扩展"的路径。
- 模糊点在于:Omni 既有对世界的理解,又能做很多传统世界模型那种用例(视觉创造),虽然现在还不是实时的——同一个模型既理解又能生成,这是最有意思的地方。
- 工程实现:Omni 是单一模型(single model),这是关键。原始诉求就是不想为每件事训 8 个不同模型——历史上是 baseline Gemini 文本模型 + 音频 + 音乐模型 Lyria + Nano Banana(图像)+ Veo 视频 + 一整套音频模型。Omni 不是路由到一堆模型,而是真正的全能模型。
- 它从现在最成熟的用例切入——视频编辑能力,所以这是当前唯一开放的能力;技术上对其他能力也 functional,只是质量还不完美、非 SOTA,所以没 roll out。这是 Omni 的第一版"Omni Flash 模型",后续会有强大得多的版本。
"它不是路由到一堆不同的模型——我们本可以那样做一个 Gemini omni 模型,但这是一个真正的 omni 模型。" —— Logan Kilpatrick
Omni 的"现场加一只狗":生成媒体该有的样子是"不改我、只改背景"
核心论点:Omni 最打动 Logan 的,是它能改掉"非我"的部分(布景、咖啡桌)却不改"我"(话、声音、形象)——这正是他想要的生成媒体形态:不是一堆 AI avatar,而是真实人格被放大。
- 完整故事:Logan 在一场演讲中与领导 model team 的朋友 Tulsi 同台。他让台下某人实时编辑视频,对方真的用 Omni 实时把现场图片编辑了一下——一只狗走上台,在编辑版里其他嘉宾低头看到狗、轻轻偷笑(这时 Logan 正在台上大谈 AI),狗跳上他的大腿,他顺势 acknowledge 那只狗、继续讲话、一边摸着它。"把这种微妙拿捏到位有那么多 subtlety,模型却 crush 了它。"——他至今还在消化这对内容创作意味着什么。
- 个人哲学:Logan 说自己历来不用 AI 做任何他产出的内容——全是他自己的话、声音、形象。"我宁可是我本人,而不是某个 AI 版本的我。"他喜欢 Omni 恰恰因为它不改"我",只改那些"不是我"的部分——他没挑现场的布景或咖啡桌,所以话可以一字不变,而那些非个人的部分可以被换成更有意思的东西。
- Sonya 自陈是"生成媒体最大的多头",并说他们做播客时"视觉和内容同等重要"——视觉是第一时间抓住注意力的方式。两人调侃这不是"水果岛视频(Fruit Island videos)"那类 AI 内容,而是"原创内容、真实的人、人格仍在,只是被放大、被变得不同"。Sonya 补一句她其实也不介意水果视频,乐见两种世界并存。
"我喜欢 Omni 的点在于它不改我,改的是那些不是我的部分——所以我们的话可以保持不变,而那些不个人的部分可以被换成更有意思的东西。" —— Logan Kilpatrick
AI Studio 里 vibe code Android:一周 35 万个应用
核心论点:AI Studio 让人 vibe code Android 应用,一周内就造了 35 万个——绝大多数是"以前根本没人会去做"的个人问题解决方案。
- 战略动机:Google 产品太多,用户在创业/把想法变成现实的旅程里会经过各种 Google 入口。AI Studio 有一条"一等原则"——把各种东西引进 AI Studio,让你不必跨 9 个不同 UI 就能接触 Google 生态的其他部分。Android 是个好例子,也让本来不会做 Android 应用的人能做了。
- Logan 自陈:他在 AI Studio 里做了人生第一个 Android 应用——不是加密 app,而是个种树/园艺 app(他在后院种树);还没想到那个让他兴奋的"突破性点子",但打算想一个去 App Store 竞争。
- 数据:上次他们今早 review 数字时,自上周以来 AI Studio 里造了约 35 万(350,000)个 Android 应用,"很疯狂"——而且令人兴奋的是这 35 万大概是"以前没人会去做"的应用,很多是个人用途。
- 判断:"用软件解决你的个人问题"现在非常真实,是这些产品最常见的用例之一;能解锁手机的一堆原生能力也很有意思,因为你有那么多分散在不同地方的 context。Android 正在成为"builders 的平台"。
- App vs Web:Web 确实强大,但操作系统有些原生丰富度是解锁不了的。Logan 以短信为例——所有主流操作系统里的短信体验都比他用过的任何 AI 聊天 app 更丰富;"如果我能在我用的短信 app 里直接跟 AI 说话,我会比跑去另一个 app 开心得多",因为我们也被操作系统 conditioned 了。
"上周以来,AI Studio 里造了大约 35 万个 Android 应用——而且这 35 万个,大概以前根本没人会去做。" —— Logan Kilpatrick
模型吃掉脚手架:12 个月后自建 harness 的 alpha 会转移
核心论点:这是全场的标题论点——"模型"早已不只是权重,而是围绕权重不断膨胀的庞大系统;脚手架领先模型几步,然后被模型吃掉、上游化进模型,alpha 随之转移。
- 历史对照:两年前 LLM 流行时,"模型"就是一组权重——尽可能简单地把 token 送进去、再拿 token 出来。如今我们仍叫它"模型"、仍叫 Gemini 3.5 / GPT / Claude,但它其实早已不只是权重,而是围绕权重构建的一整套不断扩张、蔓延的系统:从 agentic 工具调用,到托管工具(搜索、代码执行等),模型被放进容器、配上 agent harness。
- 机制:脚手架往往比"直接烤进模型里的东西"领先几步;然后模型把那部分脚手架吃掉,它变成原生模型系统的一部分。某些情况下外部脚手架仍有价值——比如 search,很多人用不同 search 提供商、有不同用例,所以即便模型能原生用 search,你也会想要外部的;code execution 是另一例。
- 最典型的当下例子就是 agent harness:"现在所有人都觉得得去建 harness、alpha 在 harness 里。"Logan 判断这一点"至少以我们今天理解 harness 的方式"在 12 个月内不再成立——模型会消化掉一大块,上游化进模型,alpha 会转移到别处,而不在"自己 spin 一个 harness"上。
- 对反方观点的回应:Sonya 指出人们自建 harness 是为了不被某个模型商锁定、应用公司要灵活性。Logan 承认这"一开始也许成立",但随模型能力提升会越来越不成立——"如果一个模型连别的 harness 都用不了,它就不是通用模型";所以模型最终应当能用上每一种 harness。
- 由此他提议做一个"harness bench"——衡量各模型适配各种不同 harness 的能力,他觉得这是生态该测的合理东西,也很好奇哪些模型最强。除非你完全 out of distribution,但那种情况下你用自己的 harness 也照样 out of distribution,所以"是否锁定其实没那么重要"。
"12 个月后,至少以我们今天理解 harness 的方式,'alpha 在自建 harness 里'这件事大概不再成立——模型会把它消化掉,原生就能做。" —— Logan Kilpatrick
应用层如何生存:聚焦是创业公司的超能力
核心论点:当模型吃掉 harness 和周边一切,独立公司靠什么活下来?Logan 的答案是——两件事同时为真:机会空前多,且聚焦让创业公司能跑赢最好的模型实验室。
- 两件看似矛盾的事同时成立:一方面"放眼望去从没有过这么多可建的机会",另一方面模型确实在做前所未有多的事。中间有几条线索:capability overhang(能力悬置)里有巨大 alpha;模型公司在追"非常通用的问题",而垂直化领域里价值极大——如果你有领域专长、懂客户、懂生态,你能绕着最好的模型实验室跑圈。
- "聚焦是创业公司的超能力——只要能聚焦,你什么都能做成。" 反观所有体量大、做很多事的公司,普遍缺乏聚焦。Logan 半自嘲地"过度合理化 Google 战略":Google 产品多、用户多、事情多,作为大公司有义务做一堆事,所以无法在单一领域聚焦——这对创业公司不成立。
- 时间维度的反转:24 个月前大家都在问"机会空间是不是在移位、未来给创业公司的机会会不会变少";事实上至今"远不是那样",反而感觉机会比当时更多。coding 帮你抹平了与"有既有代码库的大公司"的差距,让你跑得快得多、写软件更快;agentic primitive 是可围绕其建产品的新品类。
- 风险即机会:很多情况下建 agentic 产品有风险,不同公司风险偏好不同——如果你愿意在某些领域承担更多风险,你能赢得一群"也愿意冒险"的用户 cohort。"机会太多了。"
"聚焦是创业公司的超能力——只要你能聚焦,你什么都能做成。而所有做很多事的大公司,恰恰都缺少聚焦。" —— Logan Kilpatrick
GDM 文化:组合拳、领导者塑造文化、Google 的"引擎室"
核心论点:Logan 给出对 GDM 文化的三点观察——最强的"组合拳"投资组合、文化由领导者气质渗透、以及 GDM 是"Google 的引擎室"。
- 身处其中的体感:Demis、回归的 Sergey、回归的 Noam Shazeer……Logan 说"难以置信",并刻意在混乱中尽量抽身反思这个时刻。
- 观察一·组合拳与聚焦的代价:GDM 有"最强的 portfolio 之一",但正因为做很多事,会出现"别的实验室/公司在某个我们投入不足、不够聚焦的领域抢先"的时刻——他很欣赏 Google 追赶补差的方式。他看过几遍 Demis 的"thinking game"纪录片,里面那种"把一群聪明人凑到一起去解决问题"的原始文化与今天高度相似。
- 观察二·领导者塑造文化:文化从"领导者是谁"渗透出来。Demis 是诺奖科学家、很多事的 OG,你能在 DeepMind 文化里感到这种科学气质;对比之下 Sam 是"也许是世界上最好的商人之一",你能在 OpenAI 文化里看到这点;Dario 他没有强烈的判断、觉得 Anthropic 很有意思、Dario 像个"有点深奥/esoteric"的人,那种气质也写进了公司 DNA。Logan 偏爱 Demis 这种"非常科学地看世界"的方式,以及"做这件事的初衷是去解决疾病等真实问题"。
- 观察三·别迷失在数字竞赛里:他最爱的硅谷台词是剧中 Gavin Belson 的"我们不能让别人比我们更能让世界变得更好"——当下整个行业感觉就是大家在争"谁能比对方更让世界变好",这么一框就显得很 goofy,所以这本质上完全不是零和的。很容易在"谁把 SWE 分数推得更高"的竞赛里迷失,而忘了我们做这些是为了解决人类真正的问题。
- 观察三续·引擎室:GDM 是"Google 的引擎室(engine room)"——他说这现在就是 DeepMind 推特账号的 bio。一边是深植的实验室文化,一边是与 Android、Google Cloud、Gmail、Workspace 等整个 Google 生态的协作。把 Gemini 部署到十亿用户产品,是"世界上只有两家公司"面对的问题,而 Google 有 13 个这种产品——这种事只有在 Google 内部才做得到。
- 尾声轻松一笔:Sonya 问当年他加入并大量发推时,coms(公关团队)是不是很头疼、要不要审批。Logan 说这是他 Google 体验的一个 silver lining——marketing/coms 团队极好合作,他不必每条推都被审批,能用对开发者真实、有共鸣的方式讲故事;他也始终在走那条"不烧掉积累的信任与善意"的线。他的判断是:Google 很难讲出这种真实故事,因为公司大、人多、意见多,"你把 Google 的魔力通过一堆人和一堆流程稀释掉",就会丢掉那个本该很美的故事——Google 在做世界上最有意思的技术、帮用户解决最难的问题。
"我最爱的硅谷台词是 Gavin Belson 那句'我们不能让别人比我们更能让世界变得更好'——当下就是这种感觉,所有人都在争谁能比对方更让世界变好。这么一框,就显得特别傻,所以它完全不是零和的。" —— Logan Kilpatrick
附录:关键人 / 机构 / 产品 / 数据
| 项目 | 详情 |
|---|---|
| Logan Kilpatrick | 嘉宾,Google DeepMind,负责 Google AI Studio 与 Gemini API |
| Sonya Huang | 访谈者,Sequoia Capital 合伙人,生成式媒体死忠多头 |
| Demis Hassabis | Google DeepMind CEO,诺奖科学家;反复出现的产品哲学来源("建技术是为了替你做事") |
| Tulsi | Logan 的朋友,领导 model team |
| Josh | 同事,其团队用 Antigravity 端到端交付 Gemini macOS app |
| Sundar Pichai | 在 Google IO 称这是"Agentic Gemini 时代",展示内部 token 消耗增长曲线 |
| Sergey Brin / Noam Shazeer | 均已回归 Google DeepMind |
| Sam Altman / Dario Amodei | 被用作"领导者塑造文化"的对比(顶级商人 / 深奥气质) |
| Antigravity | Google 的 agent harness,含 IDE + web agent + CLI + SDK;驱动 search/Gemini app/cloud/AI Studio |
| Gemini API / AI Studio | Logan 负责的产品;AI Studio 可 vibe code Android 应用 |
| Omni / Omni Flash | 单一全能模型(非路由),从视频编辑能力切入;第一版为 Omni Flash |
| Genie | 传统 action-conditioned video model(世界模型)代表,昂贵、不可扩展 |
| Lyria / Nano Banana / Veo | Omni 之前各自独立的音乐 / 图像 / 视频模型 |
| Gemini 3 / 3.5 Flash | Gemini 3 是模型能力大飞跃;3.5 Flash 纯 post-training 收益,coding 超越此前任何 pro 模型 |
| Windsurf | 被 Google 收购,那批人最终做出 Antigravity |
| 3JS | 让很多游戏开发成为可能,但 sprite 生成等仍需编排层 |
| harness bench | Logan 提议的新基准:衡量各模型适配不同 harness 的能力 |
| 约 50 个 Google 产品 | Gemini / Antigravity 是贯穿它们的 through line |
| 13 个 13 亿+ 用户产品 | 把 Gemini 部署到十亿用户产品是世界上仅两家公司面对的问题 |
| 100,000+ 工程师 | 用 Gemini 给反馈,构成 Google 的反馈飞轮竞争优势 |
| 350,000 个 Android 应用 | AI Studio 上周以来一周内造出,多为个人用途 |
| AI Studio 应用品类 | 早期游戏约 20%;现热门为金融约 20%(多与加密相关)、个人生产力、生成媒体 |
| crawl / walk / run | Agent 成熟度分级:Google 多数产品在 crawl,Gemini app / Antigravity 接近 walk/run |
| narrow / jagged super intelligence | 窄域超智能(coding 已接近)/ 锯齿状超智能(先得垂直超智能再到 AGI) |
| GEO | generative engine optimization,对应 SEO 的生成引擎优化 |
| Gavin Belson | 美剧《硅谷》角色,Logan 最爱台词"不能让别人比我们更能让世界变好"的出处 |
| Erdős | 数学家梗:"why did Erdős have so many problems?"(proof 双关) |