137: Agent 是机会，造 Agent 的工具也是|从OpenAI开发者日聊起

节目

晚点聊 LateTalk

日期

2025-10

时长

89 min

查看原始内容 →

概述

引言

本期播客围绕 OpenAI 第三届开发者日（Dev Day）的发布内容，深入探讨了“agent”及其开发工具链（agentic tooling）的技术演进、生态构建与创业机遇。随着大模型能力逐步成熟，行业焦点正从单一模型性能竞争转向以智能体（agent）为核心的系统化应用落地。在此背景下，如何高效构建、部署、监控和优化 agent 成为关键挑战，催生了一整套新兴的工具链生态系统。

本报告基于对 AGI House 合伙人 Henry Yin 与 Naomi Xia 的深度访谈，结合 OpenAI Dev Day 最新动态，系统梳理了 agent 工具链的核心构成、平台战略演变、创业生态格局及未来趋势判断，旨在为技术开发者、创业者与投资人提供前沿洞察。

核心观点

一、OpenAI Dev Day 发布亮点：打造完整的 agent 开发生命周期支持体系

2023年10月6日，OpenAI 举办第三届开发者日，推出一系列聚焦于 agent 构建的新工具，标志着其从“对话助手”向“操作系统级平台”的战略升级。此次发布的 Agentic Kit 覆盖了 agent 开发的全生命周期，主要包括三大模块：

构建（Build）：推出可视化工具 Agent Builder，允许开发者通过拖拽方式快速搭建生产级 agent。该工具在演示中仅用8分钟即完成一个复杂工作流的构建，显著降低了开发门槛。
部署（Deploy）：发布 Chatkit SDK，提供前端 UI 组件集成能力，使开发者可将交互式界面嵌入 ChatGPT 生态，提升用户体验一致性。
监控与优化（Monitor & Optimize）：强化评估能力，推出新版 Evals 工具集，包括：
数据集管理
Trace Grading（轨迹评分）
自动化 prompt 优化
强化微调（Reinforcement Fine Tuning）

这一系列工具打通了从设计到上线再到持续迭代的完整闭环，标志着 OpenAI 正式进入“赋能开发者”的新阶段。

二、App SDK 与 APPS in ChatGPT：迈向操作系统的野心

本次发布会另一重大进展是 APPS in ChatGPT 和 App SDK 的推出，被视为 ChatGPT 向“AI 操作系统”演进的关键一步。

App SDK 基于 MCP 协议构建，不仅支持调用外部服务，还引入 UI 元素，允许开发者在 ChatGPT 内创建具有原生应用体验的交互组件。
对开发者而言，最大价值在于：
分发红利：依托 ChatGPT 当前约 8亿周活跃用户 的巨大流量池，解决初创产品的冷启动难题。
信任背书：借助 OpenAI 平台的安全合规性，更容易被企业客户接受，尤其适用于金融、法律等高敏感领域。

相比两年前 GPTs 推出时多数仅为 prompt 模板加 logo 的“伪应用”，当前工具链已能支撑真正意义上的完整应用开发，如 Canva、Figma 等合作伙伴的应用已实现账号绑定、历史数据调用与个性化生成等功能，用户体验大幅提升。

三、Agentic Tooling 的定义与发展脉络

Henry Yin 将 agentic tooling 定义为：“构建虚拟数字人所需的工具和身体部件”。它涵盖支撑 agent 实现感知、决策、执行、记忆与反馈全过程的技术栈。

典型的 agentic tooling 可分为以下几类：

#### 1. 工作流编排工具

功能：通过 if-else 条件、函数调用、多 agent 协作等方式组织任务流程。
示例：Agent Builder、N8N、Zapier。
特点：本质仍是人工编排的工作流系统，尚未实现完全自主决策。

#### 2. 评估与优化系统（Evals）

核心功能：衡量 agent 在真实场景中的表现质量。
关键技术：Trace Grading
定义：一次完整的用户与 agent 交互过程称为一个 trace（例如预订机票的全流程）。
实现方式：可通过编写评分函数进行规则判断，也可使用 LLM Judge 进行语义评估。
意义：过去这是部分创业公司的护城河，如今正被 OpenAI 标准化并开放给所有开发者。

#### 3. 状态管理与上下文存储

需求背景：传统 LLM 缺乏长期记忆，难以维持跨会话的状态。
解决方案：通过数据库、向量存储或专用中间件实现上下文持久化与检索。
相关项目：Llama Index（已被 AGI House 投资），用于构建结构化知识索引。

#### 4. 通信与协作基础设施

应用场景：多个 agent 之间需要实时通信、协调任务。
代表公司：LiveKit（AGI House 投资），提供低延迟音视频与数据通道，支持 agent 团队协同执行复杂任务。

#### 5. 身份认证与权限控制

必要性：当 agent 调用企业内部系统（如 CRM、ERP）时，需具备安全的身份验证机制。
类比对象：Okta 提供的企业级身份管理服务，未来可能演化为“agent identity layer”。

四、OpenAI 的双重战略：商业化落地 vs. AGI 终局追求

尽管 OpenAI 推出的 Agent Builder 等工具广受关注，但也引发关于其是否偏离 AGI 初衷的讨论。

理想路径（通用智能体）：
代表思路：Anthropic 的 Cloud Code，强调让 agent 尽可能自主运行，减少人工干预。
优势：基础模型升级后，所有依赖该模型的 agent 可自动受益，形成正向循环。
现实路径（可解释、可控的 workflow）：
代表思路：OpenAI 的 Agentic Kit，采用可视化拖拽+人工编排模式。
优势：对企业客户更友好，具备安全性、可审计性和快速落地能力。

OpenAI 实际上采取“我全都要”策略：

提供 Agent SDK 支持高级开发者构建自主型 agent；
同时推出 Agent Builder 满足大众开发者与非技术人员的需求。

这种双轨制反映了公司在追求 AGI 理想与应对商业化压力之间的平衡。随着公司规模扩大至数千人，并承担高额算力成本（如采购英伟达芯片、与甲骨文/AMD 深度合作），OpenAI 已进入“大而不能倒”的状态，亟需通过平台化商业模式支撑其估值增长（据估计已达5000亿美元）。

五、创业生态的机遇与挑战

AGI House 已投资约20家 AI 初创企业，涵盖 agentic tooling 多个关键环节，包括 Composio（工具集成）、Katisha（自动化代理）、LiveKit（通信层）、Llama Index（知识检索）等。

#### 机遇方面：

新平台带来新入口：APPS in ChatGPT 为早期团队提供了前所未有的用户触达机会。
工具链尚未饱和：尽管 OpenAI 提供基础能力，但在垂直场景优化、跨平台兼容、私有化部署等方面仍有大量创新空间。

#### 挑战方面：

数据不对称风险：应用运行在 ChatGPT 平台内，上下文与用户行为数据主要由 OpenAI 控制，初创公司难以获取完整数据用于产品迭代与留存优化。
平台自研竞争风险：OpenAI 已组建“Future of Work”团队，亲自下场构建销售线索转化、客服、客户成功等 B2B 场景的 agent，存在直接与第三方开发者竞争的可能性。
模型锁定问题：目前 Agentic Kit 所有环节强制使用 OpenAI 自家模型，仅 Evals 支持第三方模型接入，限制了平台开放性。

相比之下，Google 虽然也有类似复制行为，但其产品迭代速度较慢，初创公司尚有机会领先；而 OpenAI 执行力强，令开发者更为警惕。

六、平台格局展望：谁能成为最终胜出的操作系统？

未来能否容纳多个 agent 平台，取决于是否存在多个独立的大流量入口。

目前最具潜力的两大平台为：

ChatGPT（OpenAI）：拥有最强开发者生态与先发优势，工具链最完整。
Gemini（Google）：依托 Gmail、Workspace 等高频场景集成，用户量已超越 ChatGPT（计入嵌入式使用），追赶势头迅猛。

Anthropic 虽在模型安全性与可靠性上表现突出，但由于缺乏自有流量入口，在平台竞争中处于劣势。此外，MCP 协议虽为开放标准，但未赋予 Anthropic 显著差异化优势。

因此，市场很可能最终收敛为 两强主导格局：ChatGPT 与 Gemini 分别代表两种不同的生态哲学与发展节奏。

总结与启示

核心洞见提炼

1. Agent 不仅是应用形态，更是新一轮技术范式的起点

从“模型即服务”到“agent 即服务”，技术重心正从单点智能转向系统智能。真正的价值不仅在于 agent 本身，更在于支撑其运行的工具链。

2. 工具链标准化正在加速，evals 成为核心基础设施

OpenAI 将 trace grading、reinforcement fine tuning 等能力产品化，意味着原本属于少数公司的技术壁垒正在消解，推动整个生态走向成熟。

3. 平台化战略成败关键在于“开放性”与“公平性”

若 OpenAI 希望真正建立繁荣的 APP Store 式生态，必须逐步放松模型锁定、开放更多数据分析权限，并明确商业分成机制（如是否采用30%抽成）。

4. 创业机会存在于“平台之外”与“平台之下”

“平台之外”：面向特定行业（医疗、法律、制造）的定制化 agent 解决方案；
“平台之下”：构建跨平台的 agent 中间件、身份层、通信协议、调试工具等底层设施。

5. OpenAI 的“练武传功”模式具有深远影响

其内部实践（如 AI 驱动销售线索转化、全自动客服）已验证 agent 在企业流程中的可行性，并将这些经验封装为工具反哺外部开发者，形成“内生创新 → 外部扩散”的正循环。

结语

OpenAI 开发者日的发布不仅是技术更新，更是一次生态宣言：agent 时代已经到来，而平台之争才刚刚开始。对于创业者而言，既要抓住平台初期的分发红利，也需警惕依附于巨头生态所带来的长期不确定性。真正的赢家，或将诞生于那些既能利用平台势能，又能构建独立技术纵深的团队之中。

随着 agentic tooling 的不断演进，我们正逐步接近一个由无数智能体协同工作的未来——在那里，每一个 agent 都有其“身体”（工具）、“大脑”（模型）与“灵魂”（目标），而连接这一切的，正是今日正在成型的工具链网络。