#272.Meta科学家Jason Wei洞察2025年AI三大趋势

节目

嘉宾

日期

2025-10

引言：理解AI未来格局的三重框架

在人工智能技术迅猛发展的背景下，关于其未来走向的讨论呈现出前所未有的多样性与分歧。有人认为AI仅是工具升级，对工作影响有限；也有人断言AI将在数年内彻底颠覆人类职业结构。面对这种认知鸿沟，来自Meta超级智能实验室的研究科学家Jason Wei提出了一套系统性、可验证且具有前瞻性的分析框架。他在本期播客中分享了三个核心观点——智能正在商品化、验证者定律以及智能的锯齿状边缘，旨在为听众提供一个理解2025年人工智能图景的根本性视角。

作为曾任职于OpenAI与Google Brain的核心研究者，Jason Wei的研究成果如“思维链提示”（Chain-of-Thought Prompting）和“指令微调”（Instruction Tuning）深刻影响了当前大模型的发展路径。他的研究成果引用量超过9万次，显示出其在学术界与工业界的广泛影响力。本次演讲不仅基于他对AI演进历史的深刻洞察，更融合了大量实证案例与跨领域类比，构建出一套兼具理论深度与实践指导意义的认知体系。

本报告将严格依据播客内容，以清洗稿为主、ASR原文为辅，完整还原并系统化呈现Jason Wei所提出的三大核心洞见。报告不引入任何外部信息或解释，所有论点均源自访谈原声，确保内容忠实于原始语境，并通过长篇论述形式实现逻辑严密、论证充分、层次清晰的专业表达。

一、智能正在商品化：知识与推理成本趋近于零

Jason Wei首先指出，人工智能的发展正经历从“能力开拓”到“能力商品化”的根本性转变。这一过程可以被划分为两个阶段：开拓前沿与迅速普及。

在第一阶段，即“开拓前沿”，AI尚未掌握某项任务的能力，需要持续投入研发资源去解锁新功能。例如，在过去五年中，MLU（Machine Learning University）基准测试的数据表明，模型性能呈渐进式提升。这反映了AI在特定任务上仍处于探索期，其能力尚未稳定，因此获取该能力的成本较高。

然而，一旦某项能力被成功解锁，第二阶段便随之开启——迅速商品化。此时，该能力不再依赖于少数精英团队的专有技术，而是迅速向大众开放，成本急剧下降。Jason Wei用一张图表说明这一趋势：在MLU测试中达到特定性能水平所需的成本（单位：美元），每年都在显著降低。这种下降并非偶然，其背后是深度学习历史上首次真正实现的自适应计算（Adaptive Computation）。

回顾深度学习发展史，长期以来，处理任何问题所需的计算量都是固定的。无论问题是简单如“加州首府是哪里”，还是复杂如“解一道数学竞赛题”，系统都必须消耗同等规模的算力。这种刚性计算模式限制了效率与成本优化的空间。而自适应计算的出现打破了这一僵局。早在一年多前发布的OE（Open-Ended）模型中，研究人员已证实：当增加用于解决数学问题的计算资源时，模型表现明显提升。这意味着系统可以根据任务难度动态调整计算投入，从而实现“按需分配”。

这一机制带来了双重变革：一是不再需要一味扩大模型规模来提升性能，二是可以不断探索完成特定任务所需的最低计算成本。例如，对于一个极其简单的任务，AI系统能够通过反复实验找到最小可行的计算配置，从而将成本压至接近零。

这一趋势的延伸体现在信息获取方式的革命性变化。Jason Wei通过一张时间轴展示了人类获取信息效率的跃迁：

前互联网时代：若想查询1983年釜山的人口，需亲自前往图书馆，在成堆的百科全书中翻找，耗时数小时。
互联网时代：可通过搜索引擎查找网页，但需浏览多个站点，可能还需借助翻译工具，平均耗时几分钟。
聊天机器人时代：输入问题后几乎瞬间获得答案。
智能体时代（未来）：系统不仅能回答问题，还能主动执行多步操作，如访问数据库、点击导航、筛选结果等。例如，1983年釜山有多少对新人结婚？这一问题在传统搜索中极难解决，因数据分散且语言障碍存在。但OpenAI的Operator模型可通过进入CSIS数据库，逐步点击直至找到正确查询路径，最终给出答案。这一过程在几分钟内即可完成。

为了衡量此类能力，OpenAI设计了名为Browsecomp的基准测试，即“浏览竞赛”。该测试包含一系列问题，其共同特征是：答案易于验证，但寻找答案的过程极为耗时。例如，题目可能给出关于一场足球比赛的若干限制条件，要求找出唯一符合所有条件的比赛。人类平均需两小时以上才能解决部分问题，且许多问题超出了人类处理能力。然而，OpenAI的Deep Research模型已能解决其中约一半的问题，展现出显著进展。

由此得出结论：智能正逐渐成为一种商品。一旦某项能力被解锁，其获取成本将迅速趋近于零。这不仅意味着知识与推理能力的民主化，更预示着一个全新的信息生态的到来。

即时知识与无摩擦访问：信息获取的范式转移

在此基础上，Jason Wei进一步提出“即时知识”（Instant Knowledge）的概念——任何公开可得的信息，都将被实时、无缝地获取。这一理念蕴含多重深远含义。

首先，它将打破长期存在的知识壁垒。过去，某些领域的专业门槛极高，如编程、医学等。以Web编程为例，如今普通人借助ChatGPT即可获得与资深工程师相当的知识支持。同样，在个人健康领域，过去患者若想尝试“生物黑客实验”（如改善鼻腔呼吸），医生往往只提供模糊建议，而不解释背后的科学原理。而现在，AI可提供详尽、准确的医学信息，使个体具备自主实验与决策的能力。

其次，私人信息的相对价值将上升。随着公开信息成本趋近于零，信息不对称的天平开始倾斜。那些未公开、难以获取的私密信息，如尚未上市房产的内部交易数据、非公开市场投资线索等，其稀缺性与价值反而被放大。这催生了一个新的经济逻辑：信息的价值不再取决于其公开程度，而在于其独特性与隐蔽性。

最后，未来的互联网将不再是“公共互联网”，而是个性化互联网。用户不再被动浏览通用网页，而是由AI根据其需求自动构建专属信息界面。无论你想了解什么，都会有一个为你的兴趣、背景与目标量身定制的“网站”为你呈现。这种“无摩擦访问”将彻底重塑人机交互方式，使信息获取如同呼吸般自然。

二、验证者定律：可验证性决定AI进步速度

如果说“智能商品化”描述的是AI能力的扩散机制，那么“验证者定律”则揭示了AI能力突破的核心驱动力。Jason Wei将其定义为：“训练AI解决某一任务的能力，基本与该任务的可验证性成正比。”

这一命题建立在计算机科学中一个经典概念之上——验证的不对称性（Verification Asymmetry）。该现象指：验证一个解决方案的难度远低于生成该方案的难度。例如：

数独：解题困难，但一旦给出答案，只需核对每行、每列、每宫是否满足规则，即可快速验证。
编写推特代码：开发需数千名工程师协作，但验证只需打开网页、点击按钮、查看功能是否正常。
数学竞赛题：部分题目生成与验证难度相近，属于中间状态。
数据处理代码：编写可能很快，但阅读他人混乱代码却异常费时。
撰写事实性文章：编造一篇看似可信的文章极易，但核实其真实性却极为繁琐。
提出饮食法：如“只吃野牛”这一主张，提出仅需10秒，但要验证其有效性，需大规模长期实验，涉及样本量、干扰因素、结果延迟等复杂变量。

这些例子可被可视化为一个二维坐标系：横轴为生成难度，纵轴为验证难度。不同任务在该平面上的位置各异：

数独位于左下角（生成中等，验证极低）；
推特代码位于右下角（生成极高，验证极低）；
最佳饮食法位于右上角（生成极低，验证极高）；
中间任务则分布于谱系中部。

关键洞察在于：通过提供“特权信息”（privileged information），可以改变任务在该平面上的位置。例如，在数学竞赛中，若提前提供答案，则核对过程变得极为简单；在编程中，若提供测试用例，则代码审查效率大幅提升。这说明，验证的难易程度并非绝对，而是可以通过前期投入进行优化。

正是基于此，Jason Wei提出“验证者定律”：AI解决任务的能力，与其可验证性高度相关。具体而言，可验证性由五个维度构成：

1. 是否存在客观真理？即“好响应”与“坏响应”是否有明确标准；

2. 验证速度有多快？能否在毫秒级完成；

3. 是否支持大规模并行验证？能否同时验证百万级候选方案；

4. 噪声是否低？每次验证结果是否一致；

5. 是否能获得连续奖励信号？是否仅能判断“通过/失败”，还是能评估质量等级。

大多数AI基准测试天然满足上述条件。例如，数学题有唯一正确答案，验证快速且无噪声；代码测试可用自动化脚本批量运行；图像分类任务有明确标签。因此，过去五年中，所有主流基准测试均被AI迅速攻克。

Alpha Evolve：验证不对称性的极致应用

最典型的案例是DeepMind的Alpha Evolve项目。该项目利用大量计算资源，结合大语言模型与智能算法，成功解决了一系列高度依赖验证不对称性的任务。例如，求解“如何摆放11个六边形，使其外围形成的六边形面积最小”这一几何优化问题。

该问题完全符合五项可验证性标准：

客观：答案可通过图形绘制直接检查；
可扩展验证：计算性任务，可无限重复；
低噪声：每次验证结果一致；
连续奖励：外部六边形面积可量化，形成质量评分梯度。

其算法流程如下：

1. 使用大语言模型采样生成大量候选方案；

2. 对每个方案进行评分（基于外部六边形面积）；

3. 将最优方案作为下一轮采样的“灵感”输入；

4. 经过多轮迭代，性能持续提升。

值得注意的是，该项目巧妙绕开了传统深度学习中的“泛化挑战”——即模型在未见过的数据或任务上的表现。因为其目标是针对特定问题寻找最优解，而非学习通用规律。这使得系统无需担心训练与测试之间的差异，从而极大提升了优化效率。

启示：验证驱动的创业机会

基于验证者定律，可得出两个重要启示：

1. 最先被自动化的任务，将是那些验证极其简单的任务。例如，基础代码调试、文档摘要、格式转换等，因其验证标准明确、速度快、可批量执行，已成为AI优先覆盖的领域。

2. 新兴的高价值领域，将是“创造衡量标准”本身。如果某个行业缺乏清晰的评估指标，AI就难以介入。因此，未来最具潜力的创新方向之一，是为复杂任务设计可量化、可验证的评价体系。一旦建立，AI便可立即用于优化该任务。例如，为“员工创造力”设计可测量指标，或将“客户满意度”转化为可追踪的行为数据，皆属此类。

三、智能的锯齿状边缘：非线性进步下的现实图景

在众多关于AI未来的预测中，“快速起飞”（Fast Takeoff）假说广为人知：一旦AI在某方面超越人类，便会迅速自我增强，进入指数级增长阶段，最终实现超级智能。然而，Jason Wei明确表示，这种情况大概率不会发生。

他指出，自我完善能力更像一条连续光谱，而非二元开关。例如：

第0年：连代码库都无法运行；
半年后：勉强训练出模型，但效果平庸；
后续阶段：模型可自主训练，但效果仍逊于顶尖人类团队；
再往后：偶尔需人类干预以维持稳定性。

这种渐进式演进意味着，不存在突然的“临界点”。AI的进步不是跳跃式的，而是累积性的。

更深层的原因在于：AI在不同任务上的进步速度存在巨大差异。Jason Wei将其称为“智能的锯齿状边缘”（Sawtooth Edge of Intelligence）。这一比喻形象地描绘了AI能力发展的非均匀性：在某些任务上，AI进步飞速；而在另一些任务上，进展缓慢甚至停滞。

经验法则：预测AI何时能完成某项任务

为帮助听众判断AI在特定任务上的发展轨迹，Jason Wei提出了三条经验法则：

#### 1. AI擅长数字化任务

数字化任务的核心优势在于高迭代速度。当处理数字信息时，可轻松扩展计算资源，无需物理实验。相比之下，真实机器人（如Aroba）的部署受限于硬件、环境与安全风险，实验周期漫长。因此，AI在数字化任务上的发展远快于非数字化任务。

#### 2. 对人类容易的任务，对AI也往往更容易

尽管AI在某些复杂任务上超越人类，但总体而言，任务对人类的难度与对AI的难度呈正相关。例如，数学竞赛对人类困难，但对AI而言，只要数据充足、可验证，就能快速突破。反之，若人类也无法轻易完成的任务，AI通常也难以胜任。

#### 3. 数据丰富时，AI表现更好

数据是AI的燃料。语言模型在不同语言上的数学表现与该语言的文本出现频率高度相关：数据越多，性能越强。这一规律几乎普遍适用。

此外，存在一个例外情况：当存在单一客观指标时，AI可通过强化学习生成合成数据，从而突破数据瓶颈。例如，Alpha Evolve即采用此策略，通过模拟生成大量候选解，再进行筛选。

任务分类表：AI在不同任务上的进展预测

基于上述法则，Jason Wei列出了一份预测表格，用于判断AI在各类任务上的完成时间：

|------|----------|------------|----------------|--------------|

| 翻译前50种语言 | 极低 | 是 | 易获取 | 已完成 |

| 调试基础代码 | 中等 | 是 | 易获取 | 2023年 |

| 数学竞赛 | 高 | 是 | 易获取 | 2024年 |

| 进行AI研究 | 高 | 是 | 难获取 | 约2027年 |

| 化学研究 | 高 | 否 | 难获取 | 晚于AI研究 |

| 制作电影 | 极高 | 是 | 易获取 | 约2029年 |

| 预测股市 | 极高 | 是 | 易获取 | 不确定 |

| 修理家庭管道 | 中等 | 否 | 不确定 | 不确定 |

| 理发 | 极高 | 否 | 不确定 | 极难 |

从表中可见，AI的影响力集中在数字化、对人类容易、数据丰富的任务上。软件开发、数据分析、内容生成等领域将被极大加速。而理发、手工制作、情感互动等高度依赖物理感知、主观体验与非结构化数据的任务，短期内难以被替代。

对社会与职业的启示

被加速的领域：软件开发、法律文书起草、财务分析、教育辅导等，将因AI介入而效率倍增。
难以被取代的领域：理发、艺术创作、心理咨询、人际交往等，仍需人类直觉、共情与身体参与。
人类的护城河：在非数字化、高主观性、低数据密度的任务中，人类仍具不可替代优势。

总结与核心洞见提炼

综合三项核心观点，Jason Wei为我们勾勒出一幅清晰、理性且极具现实指导意义的2025年AI图景：

1. 智能正在商品化：知识与推理成本趋近于零，信息获取将实现无摩擦化与个性化，推动知识民主化与私人信息价值上升。

2. 验证者定律：AI进步的核心驱动力是任务的可验证性。验证越容易，AI越能快速攻克。未来最有潜力的创新方向，是为复杂任务建立可量化、可验证的评估体系。

3. 智能的锯齿状边缘：AI进步并非统一爆发，而是参差不齐。其影响将集中于数字化、对人类容易、数据丰富的任务。快速起飞假说不成立，自我完善是渐进过程。

最终结论

不要期待“一夜之间”的智能飞跃，而应关注“持续积累的边际进步”。
不要盲目恐慌职业被取代，而应识别哪些任务具备“可验证性+数字化+数据丰富”三要素。
不要忽视“衡量标准”的创造价值，它是通往AI赋能的关键入口。
人类的未来不在替代，而在协同：在AI无法触及的领域，人类的情感、审美、伦理与创造力，仍是不可复制的资产。

正如Jason Wei所言：“我们最终将实现对信息的无摩擦访问。”这不是一个遥远幻想，而是一个正在发生的现实。理解这三大趋势，便是理解AI如何重塑世界的第一步。

原文转录

加载中...