← 返回
132 min 2025-06

Sundar Pichai: CEO of Google and Alphabet | Lex Fridman Podcast #471

概要

Sundar Pichai 深度访谈:Google AI 战略、Gemini 产品路线、搜索的 AI 重构、组织管理与领导哲学

核心洞察

被访者:Sundar Pichai,Google/Alphabet CEO
访谈者:Lex Fridman
节目:Lex Fridman Podcast #471 · 132 分钟
核心论点:AI 是人类有史以来最深远的技术,其影响将超越火与电;Google 凭借十年布局的基础设施、世界级研究团队合并以及全产品线 AI 化,已从"被唱衰"翻盘至领跑位置;真正的竞争不在模型本身,而在将通用世界模型横向贯穿搜索、机器人、操作系统和创意工具的系统能力。

Executive Summary

  • AI 的历史定位:Pichai 重申 2017 年论断——AI 比火和电更深远,关键差异在于它是首个能递归自我改进的技术,将加速创造本身,而非仅提高既有生产力。
  • Scaling Laws 仍然有效:Google 在预训练、后训练、推理时计算、工具使用四条路径上均看到显著增长空间;下一代 Pro 模型可达上一代 Ultra 水平,且速度更快、成本更低。
  • DeepMind x Brain 合并是最关键的 CEO 决策:类比"合并斯坦福与 MIT",Jeff Dean 回归科研、Demis Hassabis 统帅、Sergey Brin 常驻 Gradient Canopy 实验室,文化融合耗时但回报巨大。
  • 搜索未死,正在进化:AI Mode 已触达数百万用户,早期指标积极;核心设计原则——AI 提供语境层,但始终将用户导向人类创建的开放网络。
  • Gemini token 量 12 个月增长 50 倍:从每月 9.7 万亿 token 飙升至 480 万亿,印证人类好奇心无上限。
  • AGI 时间表:"略晚于 2030 年",但到 2030 年进步之剧烈将迫使社会全面应对正外部性与负外部性。
  • Waymo 已完成 1000 万次付费无人出租车行程,Pichai 在外界最质疑时反而加大投资,2026 年将继续大幅扩张。
  • Android XR 眼镜将于今年进入开发者手中、明年推向消费者,Project Astra 提供自然 IO,AR 是下一个计算范式。
  • Google Beam 通过 6 个普通摄像头 + AI 视频模型生成实时光场,实现无需佩戴任何设备的"同室临场感"远程通信。

从钦奈到 Google:技术如何以离散跳跃改变人生

  • Pichai 1972 年出生于印度钦奈,全家住在一间两居室公寓。童年街头光脚打板球,车来了暂停、车走了继续,没有电脑、只有一个电视频道——"在没有计算机的年代,回想起来,空闲时间真多"。
  • 排队五年才等到一部旋转拨号电话,电话到来后邻居会到他家借电话联系亲人;他自己去医院取化验报告从往返四小时变为五分钟通话——"技术改变生活的灯泡在我脑中亮起"。
  • 家中没有自来水,严重干旱时全家靠水车排队领取每户八桶水,他和弟弟、有时还有母亲一起排队搬水回家;多年后家里装上热水器,"打开水龙头就有热水出来洗澡"的记忆至今鲜明。
  • 12 年级时终于说服父亲买了一台走私进口的松下 VCR,从此可以录世界杯足球赛、看盗版录像带——每一次技术升级都是"离散的阶梯跳跃"。
  • 祖父在邮局工作,英文书法极美,引导他大量阅读——从安·兰德到哲学到廉价犯罪小说——"这份对知识的饥渴,让我最终加入 Google 毫不意外,Google 的使命从深层打动了我"。
  • 1984 年 Pichai 12 岁,开始从书本中读到计算机,但从未见过实物。前互联网时代的信息获取方式:报纸和书籍——"那就是当时我接触世界信息的方式,如果你愿意这样说的话。"
  • 现在回到印度看到移动互联网的普及,"透过时间弧线看进步,那种感受是惊人的——真的很了不起"。
  • 给年轻人的建议:① 听从内心多于头脑来选择方向,"如果你热爱你做的事,你会看到最好的自己";② 把自己放进"房间里有人比你强、让你不自觉发出'Wow'"的环境中成长,愿意置身不舒适的境地。
金句:"我不认为你能复制第一次打开水龙头、热水涌出的那种感受。"

AI 在万年人类发明史中的定位:比火与电更深远

  • Lex 提出框架问题:如果把 12,000 年人类文明的所有技术发明按"生产力乘数"排名,AI 能否排第一?Pichai 回应说他 2017 或 2018 年就公开表态"AI 是人类有史以来最深远的技术,比火和电更深远",如今仍然坚持这一判断。
  • 他坦承存在"近因偏差"(recency bias)风险——就像体育中总倾向于把当下的选手称为史上最佳;但从第一性原理出发仍给出最高排名。关键差异在于 AI 同时具备三重属性:极速进步、能力天花板不明、递归自我改进
  • 个人经历佐证:两年前做手术时想到古人没有麻醉,"那一刻我觉得麻醉才是人类最伟大的发明"(笑)——但电、互联网、AI 这些通用技术影响范围更广。
  • 以 AlphaGo 从零开始、一天内超越人类为例,说明 AI 的自我改进速度"令人振奋,同时也令人不安"。Veo 3 模型在训练 30%、60%、100% 三个节点的采样对比,"看着它一步步学会物理规律、学会世界运行的方式,有点像看到生命涌现——既鼓舞人心,又有些令人不安"。
  • Lex 引入"新石器时代套餐"(Neolithic Package)框架:农业革命不仅是种地,还催生了陶器、社会等级、原始政府、贸易、大规模协作(金字塔、神庙)——是一整个创新网络。AI 的"套餐"同样会产生巨大的二阶、三阶效应。
  • Pichai 对 AI 套餐的第一反应是软件创作民主化:"脑中的想法可以直接变成存在的东西——过去只能用文字表达,未来可以把东西'建'出来。"他还强调了 Vibe Coding 的早期形态,以及"记住,这是它最差的时候"。
  • 另一个套餐要素是机器翻译解锁 80 亿人认知能力,以及自动驾驶、科学突破(AlphaFold、AlphaEvolve)等。
金句:"这是我们面对的第一项技术——既无法看清天花板,又能递归地自我改进。这让它处于完全不同的联赛。"

Scaling Laws、AJI 与 AGI 时间表

  • Google 内部关于 AI 前沿的"微型厨房对话"(micro kitchen conversation)参与者:Demis Hassabis、Koray Kavukcuoglu、Jeff Dean、Noam Shazeer、Sergey Brin——"我们在预训练、后训练、推理时计算、工具使用、Agentic 能力等所有维度都看到显著增长空间"。
  • 当前模型策略:不急于发布 Ultra 级模型(慢且昂贵,难以大规模服务),而是让每一代的 Pro 模型达到上一代 Ultra 的 80-90% 能力水平,同时保证推理速度和可服务性。"Scaling laws 在起作用,但在任何时间点,大家最常使用的模型都比我们能交付的最大能力落后几个月。"
  • Pichai 引用 Andrej Karpathy 的"AJI"(Artificial Jagged Intelligence)概念——模型在某些维度已惊人强大(写代码、推理复杂问题),但仍会犯数 strawberry 中有几个 r、数值计算之类的低级错误;"我觉得我们正处于 AJI 阶段——进步惊人,有些东西还不行,但整体在快速推进"。
  • Pichai 举例:在旧金山街头坐 Waymo 穿过拥挤人群,或者用 Gemini Live 的 Astra 功能对着真实世界提问,"我看到了 AGI 的闪光";但同时也能轻易发现模型的愚蠢错误——"两种体验同时在发生"。
  • AGI 时间表判断:DeepMind 在 2010 年提出 20 年达到 AGI 的路线图(即约 2030 年),Pichai 认为"会略晚于 2030 年"。但他反复强调定义不重要——"到 2030 年,不管我们怎么争论 AGI 的定义,进步之剧烈将迫使社会全面应对正外部性与负外部性。"
  • Gemini 2.5 Pro 的模型能力突破:当模型跨过某个智能阈值后,它能自主推理成吉思汗的暴力史、一战二战争议等敏感话题,不再需要人工硬编码规则来"护栏"。"从第一性原理让模型推理世界——就像你做物理或数学一样从根基出发——才是正确的构建方式,而不是由一小群人在模型上面硬编码东西。"
  • Token 量爆发数据:Gemini 月处理 token 从 12 个月前的 9.7 万亿增长至 480 万亿,50 倍增幅——"人类的好奇心没有上限"。
  • 关于衡量的难题:Pichai 认同 Lex 的观点——Gemini Flash 的实际影响可能大于 Pro,因为低延迟本身就是巨大的用户价值;传统 benchmark 越来越难以捕捉模型的真实效用。
金句:"不管我们怎么争论 AGI 的定义,到 2030 年,进步之剧烈将让所有人不得不面对它带来的后果。"

从"Google 完了"到翻盘:CEO 最关键的决策与组织手术

  • 背景:一年前大量分析师文章称"Sundar Pichai 应该下台"、"Google 在 AI 竞赛中彻底落败"。一年后 Gemini 2.5 Pro 在多项 benchmark 领先,过去一年发布了令人目不暇接的产品。
  • Pichai 回顾关键决策:① 全公司 AI-first 战略转型;② 十年前决定投资自研 TPU;③ 合并 Google Brain 与 DeepMind 组建 Google DeepMind。
  • 合并手术的难度类比:"就像有人来跟你说,把斯坦福和 MIT 的系合成一个——说起来容易做起来难。"Brain 是自下而上、项目多元的研究文化,出了很多重要突破(如 2012 年 Jeff Dean 在 Mountain View 展示神经网络识别猫的图片);DeepMind 有强烈的 AGI 路线愿景,方向感更集中。
  • 关键人事安排:Jeff Dean 主动表达想回归科研个人贡献者角色("管理占了太多时间"),Demis Hassabis 成为自然人选统帅 Google DeepMind。Pichai 强调"我们很耐心地推进合并,确保长期有效"。
  • 物理共处与文化融合策略:伦敦 DeepMind 办公室 + Mountain View "Gradient Canopy" 大楼。Pichai 每周多次步行到 Gradient Canopy 看损失曲线和模型训练进展,Sergey Brin 经常混在研究员中间一起看最新模型。"这种文化上的让团队在一起的做法,最终发挥了巨大作用。"
  • 逆势决策的心理素质——"潜水哲学":海面波涛汹涌,但下潜一英尺就是宇宙中最平静的地方。"管理 Google 就像执教巴萨或皇马——你有个糟糕赛季,外面全是噪音。"他善于区分信号与噪音,但也强调"外面有好的人在提好的观点,你要听进去"。
  • 同期还组建了专门的 AI 基础设施团队,从公司各处抽调人员,加速 TPU 产能爬坡——"外界可能不知道,TPU 扩产本身就需要大量时间,我们一直在加速这个过程"。
  • 成果验证的高光时刻:连续两天庆祝诺贝尔奖——Geoff Hinton 获奖,第二天 Demis Hassabis 和 John Jumper 因 AlphaFold 获奖。"和这样的人一起工作,一切都值得。"
金句:"当外部在质疑我们的时候,我内心能清楚看到我们正在构建的东西。这个时刻感觉是公司未来十年、二十年最大的机会——我们的定位比世界上大多数公司都好。"

Google 搜索的 AI 进化:AI Mode 与开放网络的共生设计

  • Google 搜索被称为"互联网的首页",其极简的 10 条蓝色链接设计已成为文化符号。现在 Pichai 要在上面"动刀"——但他强调这不是第一次,移动时代来临时搜索就已经不断演变。
  • AI Overviews 已在主搜索结果页上线,产品指标显著提升;AI Mode 作为独立 tab 提供前沿体验。两者的关系是"连续光谱"——AI Mode 是实验前沿,成熟功能逐步回流到主页 AI Overviews。
  • AI Mode 当前未对所有用户替换主页,"还没有到达主搜索页面的水平",但已经触达数百万用户,早期指标"非常令人鼓舞"。
  • 核心设计原则:AI 提供语境/摘要层(嵌入引用和链接),但始终将用户导向人类创建的开放网络——"这是我们的核心设计原则,不会改变"。
  • Query Fan-out 是关键技术能力:AI Mode 中模型将用户的一个查询发散为多次深度搜索,汇聚网络知识,交付远比单次搜索丰富的结果。"我们能交付更高质量的推荐——用户更可能找到他们要找的东西。"
  • 语言普惠效应是被低估的巨大影响:非英语用户通过 Gemini 的翻译能力获得对英语网站的推理式访问。"你在英语世界习以为常的那些博主和记者写的关于 AI Mode 的文章,你忘记了这现在解锁了——因为 Gemini 擅长翻译——对世界大部分不讲英语的人来说,他们的'可用互联网'一下子扩大了数量级。"
  • 广告策略分两步走:AI Mode 初期聚焦有机体验,确保用户体验做对再引入商业化;广告本质是"商业信息,也是信息",Google 对广告一直用同样的质量标准。Pichai 类比播客广告——"作为播客主持人,你在特定的位置插入广告,你自己会摸索出最合适的方式。"AI 本身将帮助找到最优呈现方式。同时在 YouTube 等产品线推进订阅 + 广告混合模式,优化点会与以前不同。
  • 关于双层网络的未来:Pichai 预见人类网络和 Agent 网络将共存——"网站会因为 AI 设计得对人类更好,同时 Agentic Web 也在快速发展。"他类比实体店与网上购物、线下餐厅与外卖的共存关系。
金句:"用户提出的问题类型发生了戏剧性变化——更长、更深入、更好奇。这正是我们为之兴奋的方向。"

AI 解锁全民创造力:从 Veo 3 到 Notebook LM,人类溢价与艺术自由

  • Pichai 以历史纵深阐述创造力的民主化轨迹:40 年前全美能做访谈节目的人可能只有 5 个;YouTube 让数十万人做到了;AI 将让数千万甚至十亿人"以更深的方式向世界输出作品"。"这种扩张性效应被严重低估了。"
  • 他用一个思想实验说明效果:"如果你把一个 1950 年代的人放到 YouTube 面前,他会疯掉。同样地,10 到 20 年后可能发生的事会让我们震惊。"
  • Veo 3 的定位不是替代艺术家,而是像画笔一样的基础设施/工具。Pichai 把 API 比作"提供电力"——你不会去限制电力的用途。他与导演 Darren Aronofsky(《Pi》导演)早期合作验证 Veo 对专业创作者的赋能潜力——"他是少数能看到未来、被它激发灵感、并为创意人指路的远见者。"
  • 关于艺术自由表达 vs 平台责任:Pichai 明确表态"艺术自由表达是社会最重要的价值之一",但也承认社会需要在基本层面界定底线。Lex 提到 Dor Brothers 等 AI-first 艺术家在"奥弗顿窗口"边缘创作的实例——暴力、性等边缘内容,引用 Hunter S. Thompson 的话"找到边界的唯一方式就是越过它"。
  • "人类溢价"(human premium)的深刻类比:没人会看 Stockfish 对弈 AlphaGo——那很无聊;但 Magnus Carlsen 对 Gukesh 的比赛让人着迷。同理,AI 内容海量增长后,人类创作中的"本质"——那种无法言说的东西——将获得溢价。Pichai 以梅西为例:即使到了现在这个年纪,几周前在圣何塞看他踢球,"当他拿到球时的那种运动方式,你能感受到那种特质,很难描述"。
  • Lex 自嘲 Notebook LM 生成的播客"可能比我做过的任何播客好 5-10 倍"——但也指出播客的真正价值可能不在于信息传递效率,而在于"看人类与信息搏斗、挣扎、把信息与自身情感和意识融合"。如果你想了解一段历史,去问 Gemini;如果你想看 Lex 与那段历史较劲,看人类播客。
  • 关于 50% 好内容由 AI 生成的时间线:Pichai 认为这取决于内容类型和使用场景,类比今天电影中 CGI 的普及——"就像作家今天用 Google Docs 写作不会特别觉得自己在用工具一样,未来创作者用 AI 工具也不会觉得有什么大不了。"他提到 James Cameron 这样的导演如果拥有这些工具会做出什么——令人期待。
  • Pichai 还提出一个关于 UI 创新的深刻观点:当前我们把模型"限制在盒子里",但如果模型本身能写代码、能理解用户偏好,它们应该能自己设计最佳界面来表达自己的想法——"简单的 UI 创新改变过世界,我认为 AI 会带来更多这样的创新"。
金句:"我确信有一天机器运球会比梅西好,但我不确定它是否能唤起我们同样的情感。"

Waymo:在质疑声最高时加倍下注的十年长征

  • Waymo 已完成 1000 万次付费无人出租车行程,Pichai 表示"最自豪的是我们对安全和雄心的同等承诺——始终在两者之间同时发力。"
  • 承认 Waymo 经历了典型的"最后 20% 花了 80% 的时间"阶段——但 Pichai 在这一阶段展现了逆势决策能力:在外部质疑最猛烈、多家自动驾驶公司退出竞争的时候,他反而决定追加投资。"当时我知道技术差距是存在的。"
  • 对 Waymo 的本质定义:它不是一家出租车公司,而是在构建一个通用 L4/5 自动驾驶技术平台——"Waymo Driver 是一项通用技术,可以应用在很多场景中"。
  • 与 Tesla 的竞合关系处理得很有 Pichai 风格:Google 是 SpaceX 最早和最大的机构投资者之一;Waymo 和 Tesla 不直接竞争(Waymo 不造车,Tesla 做整车自动驾驶);赛道足够宽广;"我默认 Elon 做什么都会成功——这不是我会去质疑的事情。在所有未来场景中,我都看到 Tesla 做得好,Waymo 也做得好。"
  • 2025 年已大幅扩张运营规模,2026 年将继续加速。
  • Pichai 呼应 Lex 关于"AI 套餐"的框架,将自动驾驶视为其中可能"改变一切"的关键发明之一——Waymo 本质上是一个碰巧有四个轮子的 AI 机器人,其技术路径与 Gemini Robotics 的研究高度相关。
  • 关于机器人业务的战略方向:Demis Hassabis 和 Google DeepMind 团队正专注于 Gemini Robotics,构建通用的底层模型。当前策略是与少数外部公司合作,但 Pichai 暗示更大的布局:"这是一个我们投入很多的领域——至于完整的规划,请继续关注,我们还没有对外完整阐述。"AI 在机器人领域的关键突破在于:硬件已经取得巨大进步,一直卡住的是软件——现在通用 AI 模型可以让机器人在真实世界中以安全、通用的方式工作。
金句:"正是在别人都在质疑 Waymo 的那个时刻,我做出了加大投资的决定。这有点违反直觉,但我们一直是一家深度技术公司。"

Chrome 创业史与 Moonshot 哲学的三条铁律

  • 时间回到 2004-2005 年:AJAX 技术让网页从静态 HTML 一夜之间进化为动态交互应用——Flickr、Gmail、Google Maps 同期涌现。但当时的浏览器从未为这个"富动态 Web"设计:JavaScript 执行极慢,没有操作系统级别的安全机制。"浏览器离成为现代 Web 的操作系统还差得远。"
  • Chrome 的核心创新思路是"把操作系统原则引入浏览器":每个 tab 独立进程沙箱(当时非常超前,现在已是标配);丹麦 Aarhus 团队打造的 V8 JavaScript 引擎——比当时最快的 JS VM 快 25 倍;全部开源为 Chromium 项目。
  • 名称故事:浏览器界面的装饰框架在英文中叫"chrome",团队觉得当时浏览器的 chrome 越来越臃肿,"我们想把它做到最小——Chrome 这个名字来自于我们要消灭 chrome"。
  • 时任 CEO Eric Schmidt 并不反对,而是"深知做浏览器有多疯狂"。创始人 Larry Page 和 Sergey Brin 在产品可以内部使用后就兴奋地参与了。"产品很快就有了生命力。"
  • Pichai 称 Chrome 是"我从零开始做产品最快乐的经历,团队太棒了"。
  • 由此引出 Moonshot 哲学的三条铁律(Pichai 归功于 Larry & Sergey):① 野心级目标吸引最优秀的人——"一流人才想做疯狂的事";② 没人跟你竞争同样疯狂的事——"你几乎独占这条路",Waymo 自动驾驶是典型案例;③ 即使只完成目标的 60-80%,结果依然是了不起的成功——"所以向大处瞄准在各方面都有优势,虽然有风险"。
金句:"Chrome 是我从零开始做产品最快乐的经历。团队太棒了。"

Android XR 眼镜与 Google Beam:下一代计算范式

  • AR 为何是下一个范式转移:Pichai 回顾计算史上的 IO 革命——GUI(图形界面)、多点触控(移动端)、语音——认为 AR 是下一个。此前 AR 被两个瓶颈卡住:① 系统集成极难(轻量眼镜里塞进所有硬件);② 没有 AI 的话 IO 太复杂、不自然。Project Astra 是解锁 AR 的关键——让用户用自然对话与眼镜交互。
  • Android XR 眼镜现场演示细节:轻量时尚外观,内置摄像头、扬声器、多麦克风(支持说话人隔离);极简首页——只显示时间、天气、日历,"设计目标是快速瞥一眼就能获得信息,然后回到你正在做的事"。
  • 导航功能:低头看脚下即显示 Google Maps 转向箭头——Lex 现场鼓掌、惊叹"太直觉了"——"出地铁、下出租车时看一眼就知道往哪走,手机留在口袋里"。
  • 实时翻译演示:Lex 用俄语对话,对方戴的眼镜上实时显示英文字幕——"就像给真实世界加了字幕"。全程可随时打断、追问 Gemini。
  • 时间表:开发者版今年推出,消费者版明年。Pichai 说:"这比其他登月计划更接近现实。"
  • Google Beam 现场演示更加震撼:演示者 Andrew 走到另一个房间,通过 Beam 系统与 Lex 面对面交流。Lex 连续惊叹"你看起来是真的"、"你从屏幕里伸出来了——不只是三维的,是朝我探出来的"。
  • Beam 技术原理:6 个普通彩色摄像头(类似普通网络摄像头)捕捉视频流,输入 AI 视频模型生成实时光场(light field),传输到光场显示器双向呈现。"不需要扫描、不需要穿戴任何设备、没有延迟。" 它不是构建你的近似模型——"你今天剃须刮伤了、别了一枚胸针,这些都实时传输。"
  • Beam 支持多人(更多人需要更宽的屏幕)、空间音频(对方说话位置不同、声音方向不同)、共享工作内容覆盖(如一起看幻灯片)。高五时"几乎能感受到被触碰的感觉"。
  • Pichai 设想的应用场景:远方祖母与孙辈互动、部署中的军人与家人通话、世界领导人面对面外交——"如果美国总统和中国领导人能通过 Beam 这样坐下来交流,也许能多推进一点?"Lex 以二战史为例:如果张伯伦当年能与斯大林面对面会面,可能改变历史。
  • YouTube 上 Beam 演示视频的热门评论精准捕捉了产品的处境:"这要么在五周内被砍掉,要么在五年内革新所有会议。"——这也是 Google 面临的 moonshot 产品管理挑战。
金句:"AR 被卡住了很久——硬件集成极难,IO 太复杂。AI 是解锁它的钥匙。"

AI 对编程与工程生产力的真实影响

  • Google 内部数据:约 30% 的代码使用了 AI 生成的建议或补全;但 Pichai 强调这不是最重要的指标。更重要的指标是公司级整体工程速度(engineering velocity)提升了 10%——"如果明天有人来告诉你,一个有数万名工程师的大型组织的生产力可以提高 10%,那是一个惊人的数字。"
  • 这 10% 与外界常说的"某某比例的代码由 AI 生成"是完全不同的维度——前者衡量的是端到端的实际工程产出,包括设计、架构、编码、测试、部署全流程。
  • 下一波飞跃将来自 agentic 能力的成熟——从代码补全建议进化到自主执行代码迁移、老旧代码库重构等任务。"想象一下,一旦我们能更稳健地做到这些,那才是真正的大解锁。"
  • 尽管 AI 让编程更高效,Google 明年计划继续增加工程师招聘——"因为我们能做的事情空间也在扩大。这是一个扩张性的故事。"
  • 对程序员职业前景的看法:AI 会拿走编程中繁琐的苦力活(grunt work),释放更多时间用于设计、架构、创造性问题解决和团队协作——"编程会变得更有趣。"类比下棋:AlphaGo 之后下棋的人比以前更多了。
  • Pichai 坚持推荐学计算机科学——"CS 远不只是编程。AI 会横向影响每个领域,但学好第一性原理思维就是好教育,不管你未来做什么。"
  • 编程面试变革:Google 至少保留一轮线下面试确保基础功力,但善用 AI 工具生成更好代码同样被视为重要技能,"这是一种同等重要的能力"。
  • Lex 用 Cursor + Gemini 编程,自称生产力提升约 5 倍。Pichai 回应说整个代码库本身也会因为 AI 变得更标准化、更容易导航,"这反过来又让 AI 更好地理解代码库,形成正反馈循环"。
金句:"如果你明天突然变得 2 倍高效,你不会闲下来——你会去创造更多东西、创造更多价值。你会从工作中获得更多满足感。"

P(doom)、乐观主义与人类文明的自我纠错机制

  • Lex 自报 p(doom)(AI 导致人类灭亡的概率)约 10%。Pichai 未给出具体数字,但构建了一个优雅的结构性论证:p(doom) 越高 -> 全人类的注意力和协调意愿越聚焦 -> 实际解决该问题的可能性越大——"存在一种讽刺性的自我调节机制"。类比他的管理哲学:如果你能让整个组织的激励对齐,几乎没有做不到的事;虽然协调全人类极其困难,但如果威胁足够大,人类确实会集体崛起。
  • "底层风险确实很高,但我对人类在关键时刻集体崛起有很大信心。"
  • Lex 提出被忽视的反事实思考:p(doom) without AI 是多少?人类有太多自我毁灭的方式——资源冲突、环境灾难、核战。AI 可能是拯救人类免于这些威胁的关键力量——"AI 让世界不再那么像零和博弈。"Pichai 表示高度认同:"在最棘手的问题上,有 AI 帮忙总比没有好。"
  • 当被问到"如果 AGI 诞生,你会问它什么",Pichai 的回答展现了内省的一面:① 它也许能主动告诉他几件"他应该知道的事情";② 它可能会以前所未有的深度帮助人类理解自己——"在个人层面,AGI 有可能以一种非常深层的方式理解你";③ 它会帮助我们拓展对宇宙的认知边界。
  • Lex 的首选问题则是"有多少存活和已灭亡的外星文明?"——以此探索费米悖论。后续追问包括:如果没有高等外星文明,是因为智慧物种发展到一定程度必然自我毁灭吗?
  • 关于什么让人类特殊:Pichai 承认随着 AI 进步,人与 AI 的界限可能变得模糊——"意识的本质、是什么让我们独一无二地成为人类,也许边界会越来越模糊"——但他的愿望是,如果 AI 让资源更充裕、世界更少零和博弈,那么人类的同理心、善意等本质属性将更多浮现,而不是被竞争和匮乏压抑。
  • 关于 AI 与自我认知:Pichai 相信 AI 的早期成果如 Co-Scientist 和 AlphaEvolve 已展现出科学发现的加速潜力。他对未来最兴奋的是"自我发现的过程"——AI 将驱动人类更深入地认识自己和宇宙。
  • 关于希望:Pichai 说他几乎永远选择"出生在当下"而非历史上任何一个时期——"这本身就是人类文明了不起的成就。某种东西告诉我,人类总会集体推进前沿。我期待未来也是如此。"
金句:"如果 p(doom) 真的很高,到那时全人类将会团结一致来应对——所以存在一种讽刺性的自我调节。我底层风险评估很高,但对人类在关键时刻崛起的信心更强。"

领导力:潜水哲学、"少发火"与管理艺术

  • 潜水隐喻(贯穿全访谈的领导力比喻):海面波涛汹涌,但下潜一英尺就是宇宙中最平静的地方——"管理 Google 就像执教巴萨或皇马——你有一个糟糕赛季,所有人都在说你不行。但你要能沉到水面下去。"
  • 分离信号与噪音:外部批评中确实有好的信号要吸收,但大多数 CEO 的日常决策"其实无关紧要,你做它们只是为了推动事情前进"。关键是识别并全力投入那少数真正"consequential"的决策。
  • 少发火的哲学:Pichai 坦承也会生气、沮丧,"我有和所有人一样的情绪"。但他观察到:① 优秀人才犯错时比你更难过,不需要你去斥责;② 沉默有时比语言更有力——"有时候不说话传递的信息更强烈";③ 发火后人们是在应激反应,而不是做正确的事。
  • disagree and commit 的实操:在重大决策会议上,他会先听完所有人的意见——"有时候他们说的确实影响了我的判断"。但一旦形成信念就明确表达、果断拍板——"如果你的决策足够清晰,人们会长期尊重这一点。"
  • 人才管理类比足球教练的"man management":不同球员需要不同方式激励。核心是激发使命感驱动的内驱力,而非制造恐惧——"你找到使命导向的人,激发他们内在的卓越追求,就能成就很多事。"
  • 一项投资驱动多条业务线:Pichai 强调这是 Google/Alphabet 作为一家公司历史上最独特的时刻——可以做一项非常深的水平投资(通用 AI 世界模型),在其之上同时推进搜索、Gmail、YouTube、Android、Waymo、机器人等多条业务线。"第一次,一项深度水平投资可以同时推动多个业务前进。"
  • 梅西 vs C 罗:Pichai 选梅西为史上最佳,但极度敬佩 C 罗的自律与对卓越的执着——"我从未见过一个运动员像他那样承诺于卓越。"儿子是 C 罗粉丝,父子一起看西班牙国家德比时阵营对立。
  • 关于谦逊和善良是否适合领导力:Pichai 认为"在一个充满关爱的领导风格下得到最好成绩的人更多",但这不意味着软弱——"偶尔也有人需要被直接告知'这不可以'"。
金句:"有时候沉默就能传递那个信息。不说话的力量,有时比说出来更大。最好的人犯了错,他们比你更痛苦。"

附录:关键人/机构/产品/数据

A. 关键数据速查

| 指标 | 数值 |

|------|------|

| Gemini 月 token 量 | 480 万亿(12 个月前 9.7 万亿,50x 增长) |

| Google 工程速度 AI 提升 | 10%(公司级整体工程产出) |

| AI 辅助代码占比 | ~30%(使用 AI 生成建议) |

| Waymo 付费行程 | 1,000 万次 |

| TPU 自研投资起始 | 10 年前 |

| Chrome V8 初始速度优势 | 25x 于当时最快 JS VM |

| DeepMind 收购年份 | 2014 |

| Brain 猫识别突破 | 2012(Mountain View) |

| XR 眼镜开发者版 | 2025 年内 |

| XR 眼镜消费者版 | 2026 年 |

| Google Beam 摄像头数 | 6 个普通彩色摄像头 |

| Pichai 首次公开称 AI 比火和电更深远 | 2017-2018 年 |

| DeepMind 早期 AGI 路线图 | 2010 年提出 20 年目标 |

B. 核心人物

  • Demis Hassabis:Google DeepMind 负责人,诺贝尔化学奖得主(AlphaFold)
  • Jeff Dean:从管理角色回归科研个人贡献者
  • Sergey Brin:Google 联合创始人,常驻 Gradient Canopy 与研究员一起看最新模型
  • Koray Kavukcuoglu:Google DeepMind 核心领导层
  • Noam Shazeer:参与"微型厨房对话"的核心研究者
  • Geoff Hinton:诺贝尔物理学奖得主(深度学习基础)
  • John Jumper:AlphaFold 核心研究者,诺贝尔化学奖得主
  • Liz Reid:Google 搜索负责人,主导 AI Mode / AI Overviews 产品策略
  • Darren Aronofsky:电影导演(《Pi》等),Veo 早期创意合作者
  • Logan Kilpatrick:倡导"发布系统而非单一模型"理念
  • Eric Schmidt:Chrome 时期的 Google CEO,支持但知道"做浏览器有多疯狂"

C. 提及的产品与技术

Gemini 2.5 Pro / Flash / Nano · Veo 3 · Notebook LM · Google Beam · Android XR 眼镜 · Project Astra · Gemini Live · AI Mode · AI Overviews · Waymo Driver · AlphaFold · AlphaEvolve · AlphaGo / Alpha Zero · Co-Scientist · TPU · V8 / Chromium / Chrome · TensorFlow · Google Scholar · Google Voice · Google Maps · Gmail · YouTube · Google Translate · Google Docs · Cursor(Lex 使用)