32 min 2025-05

OpenAI's Sam Altman on Building the 'Core AI Subscription' for Your Life

Sequoia Capital · Sam Altman

查看原始内容 →

概要

Sam Altman AI Ascent 2025 访谈：从 14 人实验室到 5 亿周活、核心 AI 订阅战略、算法仍是最高杠杆、价值创造三年节奏

核心洞察

被访者：Sam Altman，OpenAI CEO

访谈者：Sequoia Capital（AI Ascent 2025）

时长：32 分钟｜日期：2025

整理：AI 辅助纪要

Executive Summary

Sam Altman 第三次出席红杉 AI Ascent，系统阐述了 OpenAI 从 14 人研究实验室到拥有 5 亿周活用户消费产品的演化路径，以及下一阶段的战略意图。核心信号有三：① 战略定位锁定"核心 AI 订阅"——OpenAI 要做用户终身使用的个性化 AI 平台，而非单纯模型供应商；② 研究路线图前所未有地乐观——算法层仍存在 10x 甚至 100x 的突破空间；③ 价值创造三段论——2025 年 Agent 做事（编程主导）、2026 年 AI 辅助重大科学发现、2027 年机器人从好奇心变为严肃经济力量。Altman 反复强调"向前工作"而非"倒推计划"的战略哲学，并以 $400 亿融资、$3400 亿估值的弹药储备支撑其对 AI 基础设施的持续投入。

起源叙事：从 14 人研究室到 5 亿周活用户

2016 年在红杉旧办公室起步，团队约 14 人，Jensen Huang 亲自交付第一台 DGX-1（约 70 磅，"一个人还能搬动"），彼时 LLM 作为概念尚未成形，团队在白板前讨论方向，连"做产品"都是不可想象的事。
产品演化路径并非一蹴而就：GPT-1 → GPT-2（开源权重，市场反应平淡）→ GPT-3 API（2020 年 6 月上线，"硅谷注意到了，但世界没有"）→ DALL·E（第一个消费产品）→ ChatGPT（2022 年 11 月 30 日上线）。
GPT-3 时代唯一跑通商业闭环的品类是"文案写作即服务"（copywriting-as-a-service），但 Altman 观察到一个关键信号：尽管 GPT-3 的对话能力很差（尚未做 RLHF），用户却热衷于在 Playground 中与模型聊天——这一行为洞察直接催生了 ChatGPT。
ChatGPT 3.5 时代 API 可支撑的商业品类从 1 个扩展到约 8 个，团队对"人们就是想和模型对话"的信念变得极为坚定。
今天 ChatGPT 周活跃用户超过 5 亿。

组织哲学：小团队、高密度、持续出货

Altman 的组织信条：团队要小、人要忙、事要多。大公司常犯的错误是人员膨胀但产出不变，导致"40 个人挤在每个会议里争夺产品的微小部分"。
规模扩张的前提是同步扩张任务面——如果只增加人数而不增加项目数，组织就会陷入内耗。OpenAI 的做法是让相对少的人承担巨大的责任。
过去 6 个月的高产出印证了这一哲学：模型质量大幅提升，Altman 称"一个模型能把这么多事做得这么好，连我自己都惊讶"。

战略定位：做用户终身使用的"核心 AI 订阅"

OpenAI 要做的是"人们的核心 AI 订阅"——个性化 AI 贯穿多种服务、多种设备、伴随用户一生。给创业者的信号：不要做核心 AI 订阅本身，其他一切都是机会。
平台愿景尚在探索中：API/SDK 的终极形态未定，可能需要几次迭代；Altman 设想一种"HTTP 级别的新协议"，让 Agent 在认证、支付、数据传输层面天然互通。
"Sign in with OpenAI"：未来用户可用 OpenAI 账号登录第三方服务，第三方服务也可接管 ChatGPT 的 UI，实现个性化 AI 跨平台流动。
融资规模已确认：$400 亿，估值 $3400 亿，资金用途指向"海量 AI 基础设施建设"。

研究路线图：算法仍是最高杠杆

Altman 称"从未对研究路线图如此乐观"，核心目标简洁明确：更聪明的模型。
算法突破仍是最高杠杆因素：可能还剩下不多的 10x 或 100x 级别算法突破，但"哪怕只有一两个就意义重大"。
关于 GPT-5 的暗示：o3 已经"相当聪明"了，除非你认为自己"远比 o3 聪明"，否则差距已经不大。
战略哲学是"向前工作"而非"倒推计划"：Altman 明确表示没有宏大的总体规划，只做眼前一两步能看清的事，保持灵活调整。他直言"我从未见过那些宣称有精妙倒推战略的人真正大规模成功过"。

研究管理：自下而上驱动，原则从历史中"无耻抄来"

绝大多数项目应自下而上驱动，只有需要大规模协调的项目才需自上而下统筹——Altman 认为大多数人在这方面做了过多的 top-down。
OpenAI 的研究管理原则"不是我们发明的，而是从历史上优秀研究实验室无耻地抄来的"。为了理解好的研究实验室长什么样，他们回溯了很久远的历史，"几乎所有能给我们建议的人都已经去世了"。
一个反复出现的模式：来咨询这些原则的人听完后总是选择做别的事，结果通常不如遵循原则的团队。

产品方向：编程居核心，语音待突破

编程不只是一个垂直应用，而是 OpenAI 未来的核心能力：模型的理想输出不只是文本或图片，而是"整个程序"——每个响应都是定制渲染的代码，Agent 通过编写代码来驱动世界。路径演进：Assistant → Agent → Application。
语音"极其重要"但产品尚未达标：当前语音模式最令 Altman 兴奋的是"语音+触控 GUI 的叠加流"（边说话边在手机上操作），但这一交互范式尚未攻克。他相信真正人类水平的语音将催生"全新品类的设备"。
OpenAI 内部已大量使用 AI 写代码，Altman 拒绝用"代码行数占比"衡量（"用行数衡量是疯狂的"），但强调 AI 写的是"真正重要的部分"。

定制化的柏拉图理想态

Altman 描绘的终极形态：一个极小的推理模型 + 万亿 token 的上下文窗口，装入用户一生的所有对话、所有读过的书、所有邮件、所有数据源，权重永不定制、永不重训，仅靠推理在全量上下文中高效运作。
当前所有定制化方案（微调、后训练等）都是对这一理想态的妥协。公司数据同理——整个公司的数据直接追加进上下文即可。

大公司 vs. 创业公司：创造性毁灭正在发生

大公司转型迟缓不令人意外，"这在每次重大技术革命中都会发生"。典型症状：信息安全委员会一年开一次会决定允许哪些应用，而技术每两个季度就在剧变。
Altman 预测：还有约两年的"假装 AI 不会重塑一切"的抵抗期，然后是仓促投降和"为时已晚"的追赶，创业公司将全面碾压旧模式。
代际鸿沟触目惊心：大学生把 ChatGPT 当操作系统使用（复杂 prompt、连接大量文件、生活决策都依赖 AI 并利用记忆功能保持全量上下文）；20-30 岁人群当人生顾问；年长用户仅当 Google 替代品——这一差距"就像智能手机刚出来时孩子秒懂、成年人三年才学会基本操作"。

价值创造的三年节奏

| 年份 | 主题 | 代表方向 |

|------|------|---------|

| 2025 | Agent 做事 | 编程将是主导品类，还有几个其他品类 |

| 2026 | AI 科学发现 | AI 独立或辅助人类做出重大科学发现 |

| 2027 | 物理世界落地 | 机器人从好奇心变为严肃的经济价值创造者 |

Altman 的底层信念：人类历史上真正可持续的经济增长，在"殖民完地球"之后，本质上来自更好的科学知识及其落地。

创始人韧性：危机后的第 60 天才是真正的考验

Altman 从 2024 年 OpenAI 董事会危机中总结：挑战会越来越大、越来越高风险，但情绪上的承受力会随经历增强——每经历一次坏事，韧性就增加一层。
关键洞察：危机的"第零天"不是最难的——那时有肾上腺素、有支持者涌来。真正难的是"第 60 天"——如何在事后拾起碎片、重建。关于这一阶段，"我从未找到一本好书可以推荐给创始人"。
他以仍在休陪产假期间出席活动作结，体现了对红杉和社区的重视。

附录：关键人/机构/产品/数据

| 项目 | 数据 |

|------|------|

| OpenAI 成立时团队规模 | 约 14 人（2016 年） |

| ChatGPT 上线日期 | 2022 年 11 月 30 日 |

| ChatGPT 周活跃用户 | 5 亿+ |

| 本轮融资 | $400 亿，估值 $3400 亿 |

| GPT-3 API 上线时间 | 约 2020 年 6 月 |

| Jensen 交付的 DGX-1 重量 | 约 70 磅 |

| GPT-3 时代可商业化品类 | 1 个（文案写作） |

| GPT-3.5 时代可商业化品类 | 约 8 个 |