137: Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起
概述
引言
本期播客围绕 OpenAI 第三届开发者日(Dev Day)的发布内容,深入探讨了“agent”及其开发工具链(agentic tooling)的技术演进、生态构建与创业机遇。随着大模型能力逐步成熟,行业焦点正从单一模型性能竞争转向以智能体(agent)为核心的系统化应用落地。在此背景下,如何高效构建、部署、监控和优化 agent 成为关键挑战,催生了一整套新兴的工具链生态系统。
本报告基于对 AGI House 合伙人 Henry Yin 与 Naomi Xia 的深度访谈,结合 OpenAI Dev Day 最新动态,系统梳理了 agent 工具链的核心构成、平台战略演变、创业生态格局及未来趋势判断,旨在为技术开发者、创业者与投资人提供前沿洞察。
核心观点
一、OpenAI Dev Day 发布亮点:打造完整的 agent 开发生命周期支持体系
2023年10月6日,OpenAI 举办第三届开发者日,推出一系列聚焦于 agent 构建的新工具,标志着其从“对话助手”向“操作系统级平台”的战略升级。此次发布的 Agentic Kit 覆盖了 agent 开发的全生命周期,主要包括三大模块:
- 构建(Build):推出可视化工具 Agent Builder,允许开发者通过拖拽方式快速搭建生产级 agent。该工具在演示中仅用8分钟即完成一个复杂工作流的构建,显著降低了开发门槛。
- 部署(Deploy):发布 Chatkit SDK,提供前端 UI 组件集成能力,使开发者可将交互式界面嵌入 ChatGPT 生态,提升用户体验一致性。
- 监控与优化(Monitor & Optimize):强化评估能力,推出新版 Evals 工具集,包括:
- 数据集管理
- Trace Grading(轨迹评分)
- 自动化 prompt 优化
- 强化微调(Reinforcement Fine Tuning)
这一系列工具打通了从设计到上线再到持续迭代的完整闭环,标志着 OpenAI 正式进入“赋能开发者”的新阶段。
二、App SDK 与 APPS in ChatGPT:迈向操作系统的野心
本次发布会另一重大进展是 APPS in ChatGPT 和 App SDK 的推出,被视为 ChatGPT 向“AI 操作系统”演进的关键一步。
- App SDK 基于 MCP 协议构建,不仅支持调用外部服务,还引入 UI 元素,允许开发者在 ChatGPT 内创建具有原生应用体验的交互组件。
- 对开发者而言,最大价值在于:
- 分发红利:依托 ChatGPT 当前约 8亿周活跃用户 的巨大流量池,解决初创产品的冷启动难题。
- 信任背书:借助 OpenAI 平台的安全合规性,更容易被企业客户接受,尤其适用于金融、法律等高敏感领域。
相比两年前 GPTs 推出时多数仅为 prompt 模板加 logo 的“伪应用”,当前工具链已能支撑真正意义上的完整应用开发,如 Canva、Figma 等合作伙伴的应用已实现账号绑定、历史数据调用与个性化生成等功能,用户体验大幅提升。
三、Agentic Tooling 的定义与发展脉络
Henry Yin 将 agentic tooling 定义为:“构建虚拟数字人所需的工具和身体部件”。它涵盖支撑 agent 实现感知、决策、执行、记忆与反馈全过程的技术栈。
典型的 agentic tooling 可分为以下几类:
#### 1. 工作流编排工具
- 功能:通过 if-else 条件、函数调用、多 agent 协作等方式组织任务流程。
- 示例:Agent Builder、N8N、Zapier。
- 特点:本质仍是人工编排的工作流系统,尚未实现完全自主决策。
#### 2. 评估与优化系统(Evals)
- 核心功能:衡量 agent 在真实场景中的表现质量。
- 关键技术:Trace Grading
- 定义:一次完整的用户与 agent 交互过程称为一个 trace(例如预订机票的全流程)。
- 实现方式:可通过编写评分函数进行规则判断,也可使用 LLM Judge 进行语义评估。
- 意义:过去这是部分创业公司的护城河,如今正被 OpenAI 标准化并开放给所有开发者。
#### 3. 状态管理与上下文存储
- 需求背景:传统 LLM 缺乏长期记忆,难以维持跨会话的状态。
- 解决方案:通过数据库、向量存储或专用中间件实现上下文持久化与检索。
- 相关项目:Llama Index(已被 AGI House 投资),用于构建结构化知识索引。
#### 4. 通信与协作基础设施
- 应用场景:多个 agent 之间需要实时通信、协调任务。
- 代表公司:LiveKit(AGI House 投资),提供低延迟音视频与数据通道,支持 agent 团队协同执行复杂任务。
#### 5. 身份认证与权限控制
- 必要性:当 agent 调用企业内部系统(如 CRM、ERP)时,需具备安全的身份验证机制。
- 类比对象:Okta 提供的企业级身份管理服务,未来可能演化为“agent identity layer”。
四、OpenAI 的双重战略:商业化落地 vs. AGI 终局追求
尽管 OpenAI 推出的 Agent Builder 等工具广受关注,但也引发关于其是否偏离 AGI 初衷的讨论。
- 理想路径(通用智能体):
- 代表思路:Anthropic 的 Cloud Code,强调让 agent 尽可能自主运行,减少人工干预。
- 优势:基础模型升级后,所有依赖该模型的 agent 可自动受益,形成正向循环。
- 现实路径(可解释、可控的 workflow):
- 代表思路:OpenAI 的 Agentic Kit,采用可视化拖拽+人工编排模式。
- 优势:对企业客户更友好,具备安全性、可审计性和快速落地能力。
OpenAI 实际上采取“我全都要”策略:
- 提供 Agent SDK 支持高级开发者构建自主型 agent;
- 同时推出 Agent Builder 满足大众开发者与非技术人员的需求。
这种双轨制反映了公司在追求 AGI 理想与应对商业化压力之间的平衡。随着公司规模扩大至数千人,并承担高额算力成本(如采购英伟达芯片、与甲骨文/AMD 深度合作),OpenAI 已进入“大而不能倒”的状态,亟需通过平台化商业模式支撑其估值增长(据估计已达5000亿美元)。
五、创业生态的机遇与挑战
AGI House 已投资约20家 AI 初创企业,涵盖 agentic tooling 多个关键环节,包括 Composio(工具集成)、Katisha(自动化代理)、LiveKit(通信层)、Llama Index(知识检索)等。
#### 机遇方面:
- 新平台带来新入口:APPS in ChatGPT 为早期团队提供了前所未有的用户触达机会。
- 工具链尚未饱和:尽管 OpenAI 提供基础能力,但在垂直场景优化、跨平台兼容、私有化部署等方面仍有大量创新空间。
#### 挑战方面:
- 数据不对称风险:应用运行在 ChatGPT 平台内,上下文与用户行为数据主要由 OpenAI 控制,初创公司难以获取完整数据用于产品迭代与留存优化。
- 平台自研竞争风险:OpenAI 已组建“Future of Work”团队,亲自下场构建销售线索转化、客服、客户成功等 B2B 场景的 agent,存在直接与第三方开发者竞争的可能性。
- 模型锁定问题:目前 Agentic Kit 所有环节强制使用 OpenAI 自家模型,仅 Evals 支持第三方模型接入,限制了平台开放性。
相比之下,Google 虽然也有类似复制行为,但其产品迭代速度较慢,初创公司尚有机会领先;而 OpenAI 执行力强,令开发者更为警惕。
六、平台格局展望:谁能成为最终胜出的操作系统?
未来能否容纳多个 agent 平台,取决于是否存在多个独立的大流量入口。
目前最具潜力的两大平台为:
- ChatGPT(OpenAI):拥有最强开发者生态与先发优势,工具链最完整。
- Gemini(Google):依托 Gmail、Workspace 等高频场景集成,用户量已超越 ChatGPT(计入嵌入式使用),追赶势头迅猛。
Anthropic 虽在模型安全性与可靠性上表现突出,但由于缺乏自有流量入口,在平台竞争中处于劣势。此外,MCP 协议虽为开放标准,但未赋予 Anthropic 显著差异化优势。
因此,市场很可能最终收敛为 两强主导格局:ChatGPT 与 Gemini 分别代表两种不同的生态哲学与发展节奏。
总结与启示
核心洞见提炼
1. Agent 不仅是应用形态,更是新一轮技术范式的起点
从“模型即服务”到“agent 即服务”,技术重心正从单点智能转向系统智能。真正的价值不仅在于 agent 本身,更在于支撑其运行的工具链。
2. 工具链标准化正在加速,evals 成为核心基础设施
OpenAI 将 trace grading、reinforcement fine tuning 等能力产品化,意味着原本属于少数公司的技术壁垒正在消解,推动整个生态走向成熟。
3. 平台化战略成败关键在于“开放性”与“公平性”
若 OpenAI 希望真正建立繁荣的 APP Store 式生态,必须逐步放松模型锁定、开放更多数据分析权限,并明确商业分成机制(如是否采用30%抽成)。
4. 创业机会存在于“平台之外”与“平台之下”
- “平台之外”:面向特定行业(医疗、法律、制造)的定制化 agent 解决方案;
- “平台之下”:构建跨平台的 agent 中间件、身份层、通信协议、调试工具等底层设施。
5. OpenAI 的“练武传功”模式具有深远影响
其内部实践(如 AI 驱动销售线索转化、全自动客服)已验证 agent 在企业流程中的可行性,并将这些经验封装为工具反哺外部开发者,形成“内生创新 → 外部扩散”的正循环。
结语
OpenAI 开发者日的发布不仅是技术更新,更是一次生态宣言:agent 时代已经到来,而平台之争才刚刚开始。对于创业者而言,既要抓住平台初期的分发红利,也需警惕依附于巨头生态所带来的长期不确定性。真正的赢家,或将诞生于那些既能利用平台势能,又能构建独立技术纵深的团队之中。
随着 agentic tooling 的不断演进,我们正逐步接近一个由无数智能体协同工作的未来——在那里,每一个 agent 都有其“身体”(工具)、“大脑”(模型)与“灵魂”(目标),而连接这一切的,正是今日正在成型的工具链网络。