← 返回
32 min 2025-05

OpenAI's Sam Altman on Building the 'Core AI Subscription' for Your Life

概要

Sam Altman AI Ascent 2025 访谈:从 14 人实验室到 5 亿周活、核心 AI 订阅战略、算法仍是最高杠杆、价值创造三年节奏

核心洞察

被访者:Sam Altman,OpenAI CEO
访谈者:Sequoia Capital(AI Ascent 2025)
时长:32 分钟 | 日期:2025
整理:AI 辅助纪要

Executive Summary

Sam Altman 第三次出席红杉 AI Ascent,系统阐述了 OpenAI 从 14 人研究实验室到拥有 5 亿周活用户消费产品的演化路径,以及下一阶段的战略意图。核心信号有三:① 战略定位锁定"核心 AI 订阅"——OpenAI 要做用户终身使用的个性化 AI 平台,而非单纯模型供应商;② 研究路线图前所未有地乐观——算法层仍存在 10x 甚至 100x 的突破空间;③ 价值创造三段论——2025 年 Agent 做事(编程主导)、2026 年 AI 辅助重大科学发现、2027 年机器人从好奇心变为严肃经济力量。Altman 反复强调"向前工作"而非"倒推计划"的战略哲学,并以 $400 亿融资、$3400 亿估值的弹药储备支撑其对 AI 基础设施的持续投入。

起源叙事:从 14 人研究室到 5 亿周活用户

  • 2016 年在红杉旧办公室起步,团队约 14 人,Jensen Huang 亲自交付第一台 DGX-1(约 70 磅,"一个人还能搬动"),彼时 LLM 作为概念尚未成形,团队在白板前讨论方向,连"做产品"都是不可想象的事。
  • 产品演化路径并非一蹴而就:GPT-1 → GPT-2(开源权重,市场反应平淡)→ GPT-3 API(2020 年 6 月上线,"硅谷注意到了,但世界没有")→ DALL·E(第一个消费产品)→ ChatGPT(2022 年 11 月 30 日上线)。
  • GPT-3 时代唯一跑通商业闭环的品类是"文案写作即服务"(copywriting-as-a-service),但 Altman 观察到一个关键信号:尽管 GPT-3 的对话能力很差(尚未做 RLHF),用户却热衷于在 Playground 中与模型聊天——这一行为洞察直接催生了 ChatGPT。
  • ChatGPT 3.5 时代 API 可支撑的商业品类从 1 个扩展到约 8 个,团队对"人们就是想和模型对话"的信念变得极为坚定。
  • 今天 ChatGPT 周活跃用户超过 5 亿

组织哲学:小团队、高密度、持续出货

  • Altman 的组织信条:团队要小、人要忙、事要多。大公司常犯的错误是人员膨胀但产出不变,导致"40 个人挤在每个会议里争夺产品的微小部分"。
  • 规模扩张的前提是同步扩张任务面——如果只增加人数而不增加项目数,组织就会陷入内耗。OpenAI 的做法是让相对少的人承担巨大的责任。
  • 过去 6 个月的高产出印证了这一哲学:模型质量大幅提升,Altman 称"一个模型能把这么多事做得这么好,连我自己都惊讶"。

战略定位:做用户终身使用的"核心 AI 订阅"

  • OpenAI 要做的是"人们的核心 AI 订阅"——个性化 AI 贯穿多种服务、多种设备、伴随用户一生。给创业者的信号:不要做核心 AI 订阅本身,其他一切都是机会。
  • 平台愿景尚在探索中:API/SDK 的终极形态未定,可能需要几次迭代;Altman 设想一种"HTTP 级别的新协议",让 Agent 在认证、支付、数据传输层面天然互通。
  • "Sign in with OpenAI":未来用户可用 OpenAI 账号登录第三方服务,第三方服务也可接管 ChatGPT 的 UI,实现个性化 AI 跨平台流动。
  • 融资规模已确认:$400 亿,估值 $3400 亿,资金用途指向"海量 AI 基础设施建设"。

研究路线图:算法仍是最高杠杆

  • Altman 称"从未对研究路线图如此乐观",核心目标简洁明确:更聪明的模型
  • 算法突破仍是最高杠杆因素:可能还剩下不多的 10x 或 100x 级别算法突破,但"哪怕只有一两个就意义重大"。
  • 关于 GPT-5 的暗示:o3 已经"相当聪明"了,除非你认为自己"远比 o3 聪明",否则差距已经不大。
  • 战略哲学是"向前工作"而非"倒推计划":Altman 明确表示没有宏大的总体规划,只做眼前一两步能看清的事,保持灵活调整。他直言"我从未见过那些宣称有精妙倒推战略的人真正大规模成功过"。

研究管理:自下而上驱动,原则从历史中"无耻抄来"

  • 绝大多数项目应自下而上驱动,只有需要大规模协调的项目才需自上而下统筹——Altman 认为大多数人在这方面做了过多的 top-down。
  • OpenAI 的研究管理原则"不是我们发明的,而是从历史上优秀研究实验室无耻地抄来的"。为了理解好的研究实验室长什么样,他们回溯了很久远的历史,"几乎所有能给我们建议的人都已经去世了"。
  • 一个反复出现的模式:来咨询这些原则的人听完后总是选择做别的事,结果通常不如遵循原则的团队

产品方向:编程居核心,语音待突破

  • 编程不只是一个垂直应用,而是 OpenAI 未来的核心能力:模型的理想输出不只是文本或图片,而是"整个程序"——每个响应都是定制渲染的代码,Agent 通过编写代码来驱动世界。路径演进:Assistant → Agent → Application。
  • 语音"极其重要"但产品尚未达标:当前语音模式最令 Altman 兴奋的是"语音+触控 GUI 的叠加流"(边说话边在手机上操作),但这一交互范式尚未攻克。他相信真正人类水平的语音将催生"全新品类的设备"。
  • OpenAI 内部已大量使用 AI 写代码,Altman 拒绝用"代码行数占比"衡量("用行数衡量是疯狂的"),但强调 AI 写的是"真正重要的部分"。

定制化的柏拉图理想态

  • Altman 描绘的终极形态:一个极小的推理模型 + 万亿 token 的上下文窗口,装入用户一生的所有对话、所有读过的书、所有邮件、所有数据源,权重永不定制、永不重训,仅靠推理在全量上下文中高效运作。
  • 当前所有定制化方案(微调、后训练等)都是对这一理想态的妥协。公司数据同理——整个公司的数据直接追加进上下文即可。

大公司 vs. 创业公司:创造性毁灭正在发生

  • 大公司转型迟缓不令人意外,"这在每次重大技术革命中都会发生"。典型症状:信息安全委员会一年开一次会决定允许哪些应用,而技术每两个季度就在剧变。
  • Altman 预测:还有约两年的"假装 AI 不会重塑一切"的抵抗期,然后是仓促投降和"为时已晚"的追赶,创业公司将全面碾压旧模式。
  • 代际鸿沟触目惊心:大学生把 ChatGPT 当操作系统使用(复杂 prompt、连接大量文件、生活决策都依赖 AI 并利用记忆功能保持全量上下文);20-30 岁人群当人生顾问;年长用户仅当 Google 替代品——这一差距"就像智能手机刚出来时孩子秒懂、成年人三年才学会基本操作"。

价值创造的三年节奏

| 年份 | 主题 | 代表方向 |

|------|------|---------|

| 2025 | Agent 做事 | 编程将是主导品类,还有几个其他品类 |

| 2026 | AI 科学发现 | AI 独立或辅助人类做出重大科学发现 |

| 2027 | 物理世界落地 | 机器人从好奇心变为严肃的经济价值创造者 |

  • Altman 的底层信念:人类历史上真正可持续的经济增长,在"殖民完地球"之后,本质上来自更好的科学知识及其落地

创始人韧性:危机后的第 60 天才是真正的考验

  • Altman 从 2024 年 OpenAI 董事会危机中总结:挑战会越来越大、越来越高风险,但情绪上的承受力会随经历增强——每经历一次坏事,韧性就增加一层。
  • 关键洞察:危机的"第零天"不是最难的——那时有肾上腺素、有支持者涌来。真正难的是"第 60 天"——如何在事后拾起碎片、重建。关于这一阶段,"我从未找到一本好书可以推荐给创始人"。
  • 他以仍在休陪产假期间出席活动作结,体现了对红杉和社区的重视。

附录:关键人/机构/产品/数据

| 项目 | 数据 |

|------|------|

| OpenAI 成立时团队规模 | 约 14 人(2016 年) |

| ChatGPT 上线日期 | 2022 年 11 月 30 日 |

| ChatGPT 周活跃用户 | 5 亿+ |

| 本轮融资 | $400 亿,估值 $3400 亿 |

| GPT-3 API 上线时间 | 约 2020 年 6 月 |

| Jensen 交付的 DGX-1 重量 | 约 70 磅 |

| GPT-3 时代可商业化品类 | 1 个(文案写作) |

| GPT-3.5 时代可商业化品类 | 约 8 个 |