#313.AI现状2025：推理突破、机器人爆发、商业化提速与能源瓶颈 - 跨国串门儿计划

节目

日期

2025-11

时长

51 min

报告概述

本报告基于对知名风投机构Firstmark旗下“Mad Podcast”第313期节目的完整ASR文本分析，系统性地还原并深度阐释了欧洲著名风投机构Air Street Capital创始人Nathan Benach在2025年发布的年度重磅报告《AI现状报告2025》的核心内容。该报告作为全球AI领域最具影响力的行业指南之一，其长达312页的篇幅不仅反映了技术演进的复杂性与广度，更揭示了当前AI生态正经历从技术突破向商业化落地、基础设施重构与地缘政治博弈全面渗透的关键转折点。报告以“推理之年”为开篇，深刻指出2025年标志着人工智能从“生成式幻觉”迈向“可验证、可解释、可执行”的实质性跃迁，这一转变在数学竞赛、科学发现等高精度领域已初现端倪，如OpenAI与Dman均在国际数学奥林匹克竞赛中斩获金牌，而AI模型已能独立完成从文献阅读、实验设计到结果验证的完整科研流程，这预示着AI正从“辅助工具”进化为“合作者”，甚至在某些任务上超越人类专家的能力边界。

报告进一步将视野拓展至机器人技术的“寒武纪大爆发”，通过对比两年前Penny解散机器人团队的“死胡同”状态，揭示了语言模型驱动下的“行动链”（Action Chain）范式正在重塑机器人研发逻辑——即先由推理模型规划任务步骤，再由执行器实施操作，从而实现从“感知-决策-执行”到“规划-执行”的系统性升级。在商业层面，报告以详实数据证明，AI商业化已远超预期，企业支出与用户留存率双双飙升，美国44%的企业已为AI工具付费，客户平均年支出从3.5万美元跃升至50万美元，并预计明年将达100万美元，而95%的从业者在个人与职业场景中使用AI，76%自掏腰包付费，这些数据共同勾勒出一个AI深度嵌入社会经济肌理的现实图景。然而，这一繁荣背后潜藏结构性矛盾：利润率争议凸显了按Token计费模式与实际价值创造之间的错配，而“影子AI”现象则暴露了组织内部认知鸿沟，即大量员工在未获正式授权的情况下私自使用AI，反映出制度滞后于技术发展的深层挑战。

核心观点一：2025年为“推理之年”——AI能力从生成走向可验证的范式革命

2025年被Nathan Benach定义为“推理之年”，这一判断并非空泛修辞，而是建立在一系列具有里程碑意义的技术进展之上，标志着人工智能从早期依赖模式匹配的“鹦鹉式”系统，正式迈入能够进行多步逻辑推导、自我验证与闭环迭代的高级智能阶段。这一范式变革的核心驱动力在于“思维链”（Chain-of-Thought）技术的成熟与普及，其最显著的标志是2024年左右出现的OE预览版，该版本首次实现了系统展示其推理过程的能力，即能够逐步推导出复杂问题的答案，而非直接输出看似合理但缺乏依据的结论。> “大概12个月前吧，我们看到了最初的苗头，就是OE预览版，差不多就是去年的这个时候。那是我们第一次看到一个系统能展示它的推理过程，一步步的推导出一个更复杂的答案。” 这一技术突破的意义在于，它为AI系统的可信度提供了可追溯的路径，使得其决策过程不再是一个“黑箱”，从而为在高风险、高精度领域应用AI奠定了基础。

在数学与可验证成果的领域，这一进步得到了最直观的体现。多个顶尖实验室，包括OpenAI和Dman，均在国际数学奥林匹克竞赛（IMO）中取得了金牌，这一成就曾被专家普遍认为至少需要十年才能实现，如今却在短短一年内成为现实。> “我们看到好几个实验室包括 Openai 和 Demine 都在国际数学奥林匹克竞赛中拿到了金牌，要是你再问专家们，他们之前可能会觉得这得花上十年时间才能实现。” 这种能力的飞跃不仅展示了模型在符号运算与逻辑推理上的强大潜力，更重要的是，它意味着AI已经具备了处理抽象概念、构建复杂证明结构的能力，而这正是传统机器学习难以企及的领域。这种能力的提升，本质上源于模型对数学公理体系的深度理解与内化，使其能够像人类数学家一样，通过假设、反证、归纳等方法推进问题求解。

更为深远的影响体现在科学研究领域，AI正从“辅助工具”演变为“合作科学家”。Nathan Benach强调，AI模型已能独立完成从文献阅读、假说提出、实验设计、数据采集、分析到结果验证的完整科研流程。> “我们现在已经有模型可以代替人类来完成这一整套流程了，这一点很让人兴奋，因为需要阅读的论文实在太多了，AI从业者总抱怨说一年有5万篇论文要看，但。在生物化学和物理这些领域，论文数量可能还要再多一个数量级。” 这一能力的实现，直接回应了科研人员面临的“信息过载”困境，尤其是在生命科学领域，每年新增的论文数量呈指数级增长，单个研究人员根本无法穷尽所有相关文献。Dman的研究案例表明，通过整合推理模型，AI不仅能解读新的疾病靶点和作用机制，还能在真实实验室环境中得到验证，这标志着AI在科学发现中的角色已从“灵感启发”转向“实质贡献”。

此外，AI在网络安全领域的表现也印证了其推理能力的快速进化。一项研究通过衡量人类解决各类网络安全任务所需时间，再让模型执行相同任务，结果显示模型在网络安全任务上的能力每6个月翻一番。> “结果显示模型在网络安全任务上的能力每6个月就翻一翻。” 这一数据揭示了一个令人警觉的趋势：AI在攻击与防御两个维度上的能力都在飞速提升，且其速度远超人类安全团队的响应能力。相比之下，全球独立安全组织的年度总预算仅为1.34亿美元，而大型AI实验室在AI工作上的投入高达920亿美元，这意味着一个大型实验室一天的投入就相当于这些安全组织一年的总开销。> “基本上一个大型实验室一天花的钱，就相当于这些安全组织一整年的总开销。” 这种巨大的投入差距，导致了安全防护能力的严重滞后，形成了一个危险的“安全赤字”，使得整个数字生态系统面临前所未有的风险。

核心观点二：机器人技术迎来“寒武纪大爆发”——从“死胡同”到“行动链”的范式跃迁

机器人技术在过去两年间经历了从“死胡同”到“寒武纪大爆发”的戏剧性转变，这一进程的根源在于语言模型的崛起为机器人控制带来了全新的范式——“行动链”（Action Chain）的诞生。在2023年前后，机器人领域曾陷入低谷，典型例证是Penny公司解散其著名的机械手解魔方团队，这被视为机器人技术难以突破的象征。> “总的来说，大概两年前机器人技术基本算是个死胡同。呃，Penny当时解散了他们的机器人团队，那个团队曾因用机械手解魔方而闻名。” 然而，随着大语言模型（LLM）在理解和规划方面的突破，机器人技术迎来了转机。其核心思想是将机器人行为分解为两个独立但协同的模块：一个负责“思考”（推理），另一个负责“行动”（执行）。> “要的就是一种用于机器人的推理过程，在这个过程中，系统不再是简单的感知环境，然后决定如何行动。我们把这些步骤分开了，现在你有一个推理模型，它会先审视一个任务，然后规划出机器人完成这个任务所需要执行的步骤。再把这个计划交给一个执行器去实际操作，这就是所谓的行动链。”

这一范式革新最早由艾伦研究所（Allen Institute）推动，随后Jemima等机构迅速跟进，目前已有Soroc等公司成功将这项技术应用于现实世界。> “在这方面，艾伦研究所是首批推动者之一，很快，Jemima也跟进了。现在已经有一些公司包括Soroc正在把这项技术应用到现实世界里，所以这确实是可行的，不仅仅是停留在研究阶段。” 这种“规划-执行”分离的架构，极大地提升了机器人的灵活性和适应性。例如，在物流仓储这类相对受限的环境中，机器人可以被赋予复杂的任务，如“从A区取10个红色箱子，送到B区，并按重量排序”，推理模型会将其拆解为一系列子任务，如识别目标、定位、抓取、移动、放置、分类等，再由执行器精确执行。这种能力的实现，使得机器人不再局限于预设的、重复性的动作，而是能够应对动态变化的环境和非标准的任务。

尽管前景广阔，但Nathan Benach对人形机器人（Humanoid Robot）的未来持谨慎乐观态度。他认为，人形机器人的发展轨迹将类似于自动驾驶，虽然会有许多惊艳的孤立演示，但最终将被“长尾问题”所拖垮。> “所以我个人的看法是人形机器人这个领域会更像自动驾驶，我们会看到一些非常棒的孤立的演示，但最终会被长尾问题拖垮。” 这里的“长尾问题”指的是那些罕见但极其复杂的边缘情况，如在崎岖地形上行走、处理突发的物理干扰、理解模糊的人类指令等。这些问题的多样性与不可预测性，使得通用解决方案的开发成本极高，因此他预测，机器人技术的重大时刻已经到来，但主要集中在工业自动化领域，而拟人形态的机器人仍处于早期探索阶段，其大规模商业化应用尚需时日。

核心观点三：AI商业化加速——从“烧钱”到“盈利”的结构性转变

2025年，AI商业化已从早期的“烧钱”模式进入一个由强劲需求与高留存率驱动的良性循环阶段，其核心指标的跃升清晰地表明，AI已从一个备受追捧的概念，转变为企业运营中不可或缺的生产力工具。Nathan Benach指出，过去一年最引人注目的趋势是，AI产品的收入规模已达到数百亿美元，这标志着整个产业的经济可行性得到了验证。> “但是现在如果你把排名前20左右的主要 AI 公司加起来，从底层模型公司到最受欢迎的垂直应用公司，他们的总收入已经达到了数百亿美元。” 这一数字涵盖了从英伟达、OpenAI等底层基础设施提供商，到Cursors、Windsor Red等垂直应用创业公司在内的整个生态体系，其规模之大，远超两年前的预期。

支撑这一商业成功的，是用户行为的深刻改变。首先，客户留存率的显著提升是关键信号。根据与RNP合作的分析，自2022年以来，美国客户对AI产品的12个月留存率从约50%攀升至接近80%。> “2022年的时候，12个月后的留存率大概是50%而现在到了2025年这个数字已经接近80%” 这一数据表明，用户不仅愿意尝试AI产品，更愿意长期使用，这说明AI的价值已被充分验证，用户获得了持续的回报。其次，客户支出的激增同样惊人。同一份数据显示，客户在AI产品上的平均年支出从两年前的约3.5万美元，跃升至现在的50万美元，并预计明年将达到100万美元。> “大约两年前可能还只是35,000美元左右，现在已经涨到了大约50万美元，并且预计明年会达到100万美元。” 这种“单位经济效益”（Unit Economics）的改善，意味着每个客户的生命周期价值（LTV）大幅提升，为企业的可持续发展提供了坚实基础。

与此同时，市场渗透率也在快速扩大。Nathan Benach引用Ramp的数据指出，目前已有44%的美国企业在为AI工具付费。> “你在 Ramp 的数据里还提到，现在有44%的美国企业在为 AI 工具付费” 这一数字不仅反映了技术的普及，更暗示了企业组织文化正在发生根本性变革。然而，这一繁荣景象下也隐藏着深刻的矛盾。一方面，95%的个人从业者在日常工作中使用AI，但只有44%的企业在正式层面采用，这揭示了“影子AI”（Shadow AI）现象的普遍存在。> “感觉我们确实生活在一个影子 AI 的时代，在公司里虽然这么说不完全准确，但为了把你的两个数据对上，44%的企业在使用 AI 而95%的个人在使用 AI 这就意味着有很多人就像你暗示的那样，在没有得到公司正式授权的情况下，在工作中使用 AI” 这种“地下”使用模式，既反映了员工对效率提升的迫切需求，也暴露出企业内部在政策、培训和治理上的滞后。

核心观点四：基础设施瓶颈——能源、水资源与地缘政治的三重压力

AI的爆炸式增长正遭遇前所未有的物理与资源瓶颈，其中电力已成为最核心的制约因素。Nathan Benach强调，建设一个几瓦（TeraFLOPS）级别的AI数据中心，其资本支出（CapEx）高达500亿美元，年运营成本（OpEx）在80亿至110亿美元之间，甚至可能更高。> “对我来说，最关键的数据是一个几瓦的人工智能数据中心，资本支出基本上就要500亿美元，而每年的运营成本大概还要再花80亿到90亿，甚至可能高达110亿美元。” 这一数字揭示了AI算力的极端昂贵性，使得数据中心的选址与建设成为一场关乎国家竞争力的战略博弈。

能源采购的困境尤为突出。传统能源来源如煤炭、天然气或太阳能，都面临供应不稳定或地理限制的问题。因此，各大科技巨头正积极寻求与核能公司合作，例如谷歌与CFS达成协议，计划从一个仍在规划中的聚变发电厂购买200兆瓦的电力。> “比如谷歌和CFS达成协议，计划从一个仍在规划中的聚变发电厂购买200兆瓦的电力，所以那个发电厂现在还不存在。” 这种“未来能源”的交易，凸显了当前能源供给的严重短缺。短期内，燃气轮机成为替代方案，因其部署速度快，但其噪音巨大，且美国本土的供应有限，迫使科技公司不得不高价从海外“遣返”设备，加剧了供应链紧张。> “而且美国以外对这些设备也有需求，所以现在美国科技公司基本上是在花更多的钱把一些本该运往国外的供应给遣返回来。”

水资源问题同样严峻。冷却庞大的GPU集群需要消耗巨量的水，而适合建设数据中心的地区往往极度干旱。报告特别指出，美国新增电力容量（48.6吉瓦）远低于中国（429吉瓦），这使得美国在能源竞争中处于劣势。> “如果我没读错的话，2024年美国新增的电力容量是48.6G瓦，而中国是429G瓦。” 在水资源方面，数据中心的冷却需求可能导致挤占居民用水，且水循环利用可能造成水质污染，进而影响整个供水系统。> “所以如果你的州非常干旱，水从哪里来？这会不会挤占人类居民的用水？然后你还有水循环利用的问题，这可能会导致水质差的水进入整个供水系统。” 尽管大公司曾承诺2030年实现绿色能源，但一旦签订能源协议，这些承诺便被搁置，现实的运营需求压倒了环保理想。

核心观点五：芯片格局与主权AI——英伟达霸权与地缘政治博弈

在硬件层面，英伟达（NVIDIA）的绝对霸主地位在2025年进一步巩固，其市场份额呈现出典型的帕累托法则（80/20法则），即95%的市场由英伟达主导。> “我觉得会是95对5的局面，又回到95%了，帕累托法则重现了。” 这一结论基于对49,000篇开源AI研究论文的分析，结果显示90%的论文均使用英伟达芯片进行训练。> “如果你做这个分析，你基本上会发现90%的论文都使用了英伟达的芯片” 与此同时，AMD和苹果芯片虽有零星出现，但主要源于MacBook性能提升带来的本地训练需求。博通（Broadcom）的崛起则预示着下一个阶段的到来——定制化ASIC芯片的兴起。> “博通大概在10年前收购了一家公司，现在这家公司的内部团队正在为谷歌的TPU制造定制的ASIC芯片。” 博通与谷歌、OpenAI的合作，表明当Transformer架构趋于稳定后，厂商将转向制造专用芯片以榨取最大价值。

地缘政治深刻影响了芯片生态。美国对中国出口高端AI芯片的政策摇摆不定，直接催生了中国本土芯片生态的崛起。例如，H20芯片的出口政策反复，从允许到禁止再到有条件开放，最终导致寒武纪（Cambricon）股价大涨。> “比如 h 20芯片一度被美国政府认为是允许出口的，后来又被认为不行。再后来又说如果把15%~20%的收入返还给美国政府，那就可以。” 这种政策不确定性，反而促使中国加速构建自主可控的全栈技术生态，华为芯片成为默认选择。> “所以你提到了寒武纪，然后华为的芯片无论型号是什么，正在成为中国技术站的默认芯片。” 政府与企业间的互动也日益紧密，如政府试图推动Deepseek等实验室在中国芯片上运行模型，这在一定程度上延缓了新一代模型的研发进度。

核心观点六：AI的未来趋势与投资启示——从“泡沫论”到“价值创造”

面对外界关于“AI泡沫”的争论，Nathan Benach认为，宏观层面的“泡沫”更多是局部的、结构性的，而非整体崩溃。> “我觉得就像市场上的大多数事情一样，可能到处都存在局部的泡沫。” 他指出，华尔街与西海岸的分歧，本质上源于投资视角的不同：前者关注金融工程与债务杠杆，后者则坚信技术本身行得通。> “纽约的金融圈谈论泡沫的频率绝对比我们在旧金山谈论的要多得多。在旧金山，大家的看法是现在是AI的黄金时代，很多东西都行之有效，而且我们还有太多事情可以做。” 这种分歧反映在投资标的上，公开市场上纯粹的AI公司极少，投资者主要通过英伟达、七大科技巨头或间接投资电力、能源公司来参与。

对于未来的投资方向，Nathan Benach强调，真正的价值创造来自于“AI优先”（AI-first）的公司。> “我最关心的一个宏观问题是你如何构建和利用 AI 来创造全新的产品体验和新兴公司” 这类公司不仅产品依赖AI，其企业文化、人才结构和资源配置方式也围绕AI重构。他重点投资于金融科技、生物技术（如Profluent开发首个AI创造的CRISPR基因编辑器）和国防领域。> “最近投资了Profluent 它在蛋白质设计的语言模型方面处于领先地位，开发了第一个由AI创造的CRISPR基因编辑器。” 此外，他看好语音技术（如Eleven Labs）、临床试验工具（如Delphi）以及生成式世界模型（如谷歌Genie VLOGGER）等前沿方向。

总结与启示

综上所述，2025年的全球AI生态正处于一个前所未有的十字路口。技术上，推理能力的突破使AI从“能说”走向“能想”；商业上，高留存率与高支出预示着成熟的商业模式；基础设施上，能源与水资源的瓶颈正将技术发展推向政治与地缘的前台；而在投资层面，英伟达的霸权与主权AI的博弈，揭示了技术力量与国家意志的深度融合。Nathan Benach的报告不仅是对现状的描绘，更是对未来的一份战略地图。它提醒我们，AI的未来不仅是技术的胜利，更是系统性能力的较量——谁能更好地整合技术、资本、人才与政策，谁就能在这场变革中占据制高点。

原文转录

加载中...