AI的商业鸿沟 | MIT NANDA报告 | 95%的企业AI投资没有回报

节目

日期

2025-10

概述

——基于MIT NANDA《2025年商业AI现状报告》的专业访谈报告

引言：当AI投资遭遇“价值断层”

近年来，生成式人工智能（Generative AI）以前所未有的速度席卷全球企业。从营销文案自动生成到代码辅助编写，从客户服务自动化到合同智能审查，AI的应用场景不断扩展。然而，在这场看似全民参与的技术浪潮中，一个令人警醒的现象正在浮现：尽管企业在生成式AI上累计投入高达300至400亿美元，绝大多数组织却未能从中获得实质性回报。

麻省理工学院NANDA项目于2025年发布的《商业AI现状报告》，通过对300多个公开AI项目的系统分析、对52家组织代表的结构化访谈以及153位高管的问卷反馈，揭示了一个关键结论：95%的企业在生成式AI上的投资没有产生任何可衡量的价值回报，仅有5%的试点项目真正创造了数百万美元级别的经济价值。这一悬殊差距被研究者定义为“生成式AI鸿沟”。

本报告旨在深入解读该研究的核心发现，系统剖析以下三大核心问题：

1. 生成式AI鸿沟的真实形态是什么？它是否仅仅是资源分配不均的结果？

2. 为何大多数企业陷入“高采用、低转型”的困境？阻碍规模化落地的根本原因何在？

3. 那些成功跨越鸿沟的企业和初创公司做对了什么？是否存在可复制的战略路径？

通过还原报告中的实证数据与典型案例，本文将为企业提供一份基于现实洞察而非技术幻想的行动指南，帮助识别当前AI部署中的结构性盲区，并指出通向价值实现的关键转折点。

值得注意的是，这份报告颠覆了诸多流行认知。例如，AI鸿沟并非简单地表现为大企业与小企业之间的技术获取能力差异；相反，即便是拥有充足预算和技术团队的大型组织，也普遍面临AI工具无法融入实际业务流程的窘境。真正的分水岭不在于“有没有AI”，而在于“能不能用出价值”。

与此同时，研究进一步指出，跨过这道鸿沟的窗口期正在迅速关闭——未来18个月内，企业将逐步锁定具备持续学习能力的AI系统，一旦错过，可能面临代际落后的风险。因此，理解当前AI应用的成败逻辑，已不仅是技术选型问题，更是一场关乎组织适应力与战略前瞻性的竞争。

接下来的内容将围绕三个维度展开：首先描绘生成式AI鸿沟的具体表现及其背后的结构性失衡；其次深入探讨导致“试点多、落地少”的根本障碍，尤其是“学习差距”这一被广泛忽视的核心瓶颈；最后总结成功者的共性策略，提炼出三条可操作、可验证的战略原则，为仍在探索中的企业提供清晰的方向指引。

核心观点一：生成式AI鸿沟的本质是“高采用、低转型”

1. 鸿沟不是“有无之别”，而是“价值转化率”的断裂

传统观念认为，AI发展不平衡主要体现在资源占有层面——大企业能负担昂贵模型训练成本，中小企业只能依赖公共API或免费工具。但MIT NANDA报告明确指出，这种理解已经过时。如今几乎所有企业都能接触到生成式AI技术，无论是通过采购企业级解决方案，还是员工自发使用个人订阅服务（如ChatGPT Plus），AI的普及程度极高。

真正的鸿沟在于：即便广泛采用了AI工具，绝大多数企业仍未能将其转化为可持续的商业价值。换句话说，AI鸿沟的本质不是“有没有”，而是“会不会用”、“能不能创造回报”。

研究数据显示：

80%的企业曾尝试通用大语言模型（LLM）的试点；
近40%完成了初步部署；
但对于定制化的企业级AI工具（包括自建或供应商提供），仅有5%最终成功落地并进入生产环境。

这意味着，尽管表面上看AI已被广泛采纳，但在从“实验”走向“运营”的过程中，绝大多数项目中途夭折，形成了典型的“死亡谷”现象。

2. 行业颠覆指数揭示结构性停滞：仅两个行业出现显著变革

为了量化不同行业的AI渗透深度，研究团队构建了“AI市场颠覆指数”，从五个维度评估各行业因AI引发的变化程度：

头部企业市场份额波动
2020年后成立的AI原生公司营收增长
新AI商业模式的出现
用户行为变化
因AI引发的管理层变动

评分范围为0~5分，结果显示：

| 行业 | 得分 |

|------|------|

| 科技 | 3.8 |

| 媒体与电信 | 2.1 |

| 专业服务 | 1.5 |

| 医疗健康 | 0.5 |

| 金融服务 | 0.5 |

| 能源与材料 | 0.5 |

只有科技和媒体与电信两个行业得分超过1.5，其余七个主要行业几乎未发生结构性改变。

#### 科技行业的动态重构

在科技领域，已有新玩家挑战传统巨头。例如，代码编辑器Cursor正与微软Copilot展开直接竞争，其AI驱动的工作流正在重塑开发者的日常实践。开发者不再只是被动接受建议，而是与AI协同完成复杂任务，工作模式发生实质性转变。

#### 媒体与内容生态的迁移

媒体行业则表现出用户行为和商业模式的双重调整。AI生成内容的比例持续上升，广告投放策略也随之演化——平台开始依据AI内容特征优化推荐算法，传统媒体机构也不得不重新设计内容生产和审核流程以应对冲击。

#### 其他行业的“近零采用”状态

相比之下，能源与材料等行业虽有零星试点，但并未对供应链管理、生产调度或设备维护等核心环节产生实质影响。一位中型制造企业的CEO坦言：“LinkedIn上全是AI改变一切的帖子，但在我们的实际运营里，除了合同处理快了点，没什么根本的变化。”

这说明，AI的影响远未达到普遍预期中的“颠覆性”。多数企业仍停留在边缘性效率提升阶段，未能触及业务本质。

3. “影子AI经济”暴露正式系统的失效

另一个极具讽刺意味的现象是“影子AI经济”的兴起。调查显示：

只有40%的企业官方采购了大语言模型订阅服务；
但高达90%的员工在工作中使用个人AI工具，如自费购买ChatGPT会员、云端推理服务等。

这种反差背后反映的是企业级AI系统的严重脱节：

个人工具灵活、响应快、交互自然，适合快速撰写邮件、会议纪要、PPT初稿等轻量任务；
而企业推广的AI平台往往步骤繁琐、输出不稳定、缺乏上下文记忆，导致用户体验极差。

一位法务人员表示：“我宁愿用ChatGPT写法律意见草稿，也不愿用公司花几十万买的合同分析系统，因为它每次都要重新输入背景信息，还记不住我的修改偏好。”

这表明，员工并非抗拒AI，而是拒绝无效的AI。当正式系统无法满足真实工作需求时，员工便会绕开组织架构，自行寻找替代方案。这种“地下采用”虽然提升了个体效率，却带来了数据安全、合规性和知识孤岛等一系列新问题。

4. 投资错配加剧鸿沟：预算集中于“可见成果”，忽视高ROI后台场景

研究还发现，企业在AI预算分配上存在明显误区。当被要求模拟分配100美元的AI预算时，约70%的资金流向销售与营销部门，主要用于：

自动生成营销邮件
客户线索评分
社交媒体内容创作

原因在于这些领域的成果易于量化——回复率、点击率、Demo预约数量等指标可以直接对接董事会KPI，便于向上汇报。

然而，真正具有高投资回报率（ROI）的潜力场景却被严重低估，尤其是在后台职能部门：

法务：合同审查自动化可节省大量人工时间
采购：供应商比价、条款合规检查可通过AI加速
财务：发票处理、异常交易检测具备高度重复性

一位财富1000强制药公司的采购副总裁抱怨道：“我想引入一个AI工具帮团队提速，但怎么证明它的价值？难道跟CEO说‘我们让科学家更快拿到试剂’吗？这跟营收没有直接关系，根本说不通。”

结果是，企业宁愿把钱花在“看得见”的前端，也不愿投入“看不见”但更具长期效益的后台。这种短视的投资逻辑进一步拉大了价值创造的差距。

核心观点二：阻碍AI规模化的根本原因是“学习差距”

1. 真正的瓶颈不在基础设施或人才，而在“不会学习的AI”

长期以来，业界普遍将AI落地困难归因于三类外部限制：

缺乏算力基础设施
数据隐私与监管障碍
AI人才短缺

但MIT NANDA报告通过高管调研得出截然不同的结论：阻碍AI规模化的核心因素并非上述任何一项，而是“学习差距”（Learning Gap）——即现有AI工具不具备持续学习、积累经验、适应具体场景的能力。

在52家组织的反馈中，AI试点失败的主要原因排名如下：

1. 用户不愿采用新工具（排名第一）

2. 模型输出质量不可靠（紧随其后）

而“质量担忧”的根源正是AI缺乏记忆与进化机制。员工可以容忍ChatGPT偶尔出错，因为它是辅助工具；但在企业环境中，AI若在合同审查、客户数据分析等高风险任务中犯错，则可能导致重大损失。

2. 企业AI工具的四大痛点源于“无记忆”设计

研究总结出用户对企业级AI工具最不满意的四个特征，全部指向“学习能力缺失”：

• 在特殊场景下容易崩溃且无法调整

许多AI系统基于通用模型微调而成，面对非标准输入时表现脆弱。例如，某律所采购的合同分析工具，在遇到非常规条款时频繁误判，且无法通过反馈进行修正。

• 无法深度集成到个性化工作流中

工具功能固定，难以根据组织特有的审批流程、文档格式或协作习惯进行配置，导致“水土不服”。

• 每次使用都需重复输入上下文

当前多数AI系统不具备持久记忆，用户每次交互都必须重新说明背景，极大降低效率。

• 无法从用户反馈中学习改进

即使用户多次纠正错误，系统也不会记住这些教训，下次依然重复相同错误。

一位公司法务举例：“我处理一份并购合同时指出某个风险点，系统没识别出来。我以为它会记住，结果下一次同样的问题又出现了。我怎么可能信任这样的工具？”

3. 复杂任务依赖上下文连贯性，碎片化AI难以胜任

进一步的数据表明，AI的适用性与任务复杂度密切相关：

对于简单任务（如写邮件、做基础分析），70%用户愿意使用AI；
但对于复杂、跨周期的任务（如项目管理、客户关系维护），90%用户宁愿求助同事而非AI。

原因在于，复杂任务需要系统具备上下文延续能力——能够记住过往沟通、理解角色职责、跟踪进度变化。而当前大多数AI工具只能处理孤立请求，无法维持长期对话或任务链条。

这也解释了为什么AI尚未取代人类协作的核心地位。人们需要的不是一个“问答机器人”，而是一个能像资深助理一样“记得事、懂规矩、会成长”的伙伴。

4. 解决路径：向“智能体AI”（Agentic AI）演进

研究者提出，突破学习差距的关键在于转向“智能体AI”（Agentic AI）。这类系统具备以下特性：

自主执行任务，无需持续人工干预
拥有持久记忆，能够积累用户偏好和历史决策
支持迭代学习，可根据反馈不断优化表现
可协调多步骤工作流，实现端到端自动化

已有成功案例验证其潜力：

客服智能体：从接收客户咨询开始，全程跟进问题解决，无需转接人工；
财务智能体：监控常规交易流，自动审批符合规则的报销单据，仅将异常情况提交审核；
采购智能体：跟踪供应商报价变化，主动提醒续约节点，甚至发起比价谈判。

这些系统之所以成功，正是因为它们解决了“记不住、学不会”的根本痛点，成为真正嵌入业务流程的“数字员工”。

5. AI工具四象限分类：未来属于“高定制+高学习”组合

为帮助企业识别真正有价值的AI工具，报告提出一个二维分类框架：

| 维度\类型 | 低学习能力 | 高学习能力 |

|----------|------------|------------|

| 低定制化 | 第一类：Copilot、GPT包装工具
• 易用但不灵活
• 适用于通用场景 | 第二类：带记忆的ChatGPT
• 能记住上下文
• 但无法修改工作流 |

| 高定制化 | 第三类：企业自建AI工具
• 表面贴合需求
• 实际脆弱易崩 | 第四类：智能体工作流、垂直SaaS
• 深度定制
• 持续学习
• 跨越鸿沟方向 |

显然，第四类工具才是未来发展方向。它们不仅适配特定业务流程，还能随着时间推移变得越来越聪明，形成正向反馈循环。

核心观点三：成功者的共同选择——买、前线主导、重学习能力

1. 优先“买”而非“建”：合作模式成功率翻倍

报告显示，AI项目的成功落地率存在显著差异：

外部合作项目：67%成功落地
企业自建项目：仅33%成功，相差整整一倍

失败的自建项目普遍存在以下问题：

过度关注技术参数，忽视实际可用性
花费数月调试模型，却发现与业务流程不匹配
上线后缺乏持续维护，工具逐渐退化失效

而成功的采购案例则展现出完全不同的逻辑。

#### 案例：金融服务公司转向专业供应商

一家年营收50亿美元的金融企业最初试图自建客户风险评估AI系统，历时三个月毫无进展。随后转向一家专注于金融风控的AI供应商，对方已具备成熟的风险建模能力，仅需对接客户数据即可启动试点。两个月内完成部署，每年节省100万美元外包成本。

关键在于：买的是“解决方案”而非“软件”。供应商不仅提供技术，更承担起流程适配、持续迭代的责任，成为企业的延伸团队。

#### 合作不是终点，而是起点

成功的买家不会仅凭Demo就签约，而是采取更深度的合作方式：

邀请供应商参与内部工作坊，共同梳理业务流程
在试点阶段出现问题时，不急于终止，而是联合排查原因
建立定期反馈机制，推动模型每周迭代优化

例如，某零售企业与AI供应商合作客服自动化项目，初期准确率仅为60%。企业未解约，而是组织客服团队系统整理常见问题及正确回答，交由供应商用于训练。经过三个月迭代，准确率提升至90%，最终每年节省200万美元外包费用。

这表明，成功的AI部署本质上是一种协作过程，而非一次性采购行为。

2. 让业务前线主导，而非中央实验室闭门造车

许多企业推行AI的方式是由IT部门或“AI创新实验室”牵头，统一选型、集中推广。但这种方式往往失败率极高，原因在于：

实验室不了解一线真实痛点
所选工具过于技术导向，缺乏实用性
推广过程强制推行，员工抵触情绪强

相比之下，成功企业普遍采用“自下而上”的推进策略：

由一线经理或“超级用户”发起试点
工具选择基于实际工作需求
成效显著后再向上申报推广

#### 案例：制造企业采购经理自主引入合同工具

某制造企业采购部门经理发现团队每天耗费两小时整理供应商合同，遂自行寻找一款合同自动化AI工具进行试点。效果良好后上报总部，最终获得全面推广。

#### 案例：识别“超级用户”作为测试先锋

有的企业专门筛选那些已在日常工作中熟练使用ChatGPT的员工，邀请他们参与新工具测试。这些人清楚什么样的AI真正提效，能有效规避“好看不好用”的陷阱。

这种方法的优势在于：

决策贴近真实业务场景
试点见效快，说服力强
推广阻力小，接受度高

数据显示：

中型企业从试点到全量部署平均仅需90天
大型企业若由中央实验室主导，平均耗时超过9个月，相差三倍

速度差异的背后，是组织决策机制的根本不同。

3. 关注后台ROI：减少外部支出而非裁员

尽管大多数企业将AI预算投向前端销售与营销，但真正实现高回报的案例多集中在后台职能部门。成功企业的一个共性是：紧盯后台自动化带来的成本节约，而非追求裁员式降本。

典型回报来源包括：

• 替代客服外包：年节省200万~1,000万美元

• 减少外部创意代理费用：AI生成基础素材，降低对外依赖

• 优化风控流程：AI完成初步筛查，减少第三方审计支出

更重要的是，这些企业几乎没有大规模裁员。AI的作用不是替代人力，而是解放重复劳动，使人转向更高价值的工作：

客服人员从接听简单咨询，转为处理复杂投诉与情感沟通
采购专员从整理合同，变为参与供应商谈判与流程优化
法务人员从初审标准化条款，升级为参与战略合同设计

这种转型实现了双赢：企业降低成本，员工提升职业价值，避免了因AI引发的组织动荡。

总结与启示：跨越鸿沟的三大战略选择

MIT NANDA报告最终提炼出一条清晰路径：生成式AI鸿沟并非不可逾越，但它要求企业做出不同于主流做法的选择。那些仍在“高采用、低转型”泥潭中挣扎的企业，仍有调整空间，但窗口期正在迅速收窄——研究预测，未来18个月内，企业将基本完成AI工具的选型与锁定。

一旦数据流程与某一AI系统深度绑定，切换成本将急剧上升。例如，若某AI已学习了一年内的合同模板、审批规则和用户偏好，更换新系统意味着重新训练所有知识，代价高昂。目前微软、OpenAI等巨头已在为其工具添加持久记忆功能，生态壁垒正在形成。

展望更远未来，AI将进入“智能体网络”（Agentic Web）时代：

不再是单一AI工具，而是一群具备自主决策能力的智能体
能跨平台、跨组织协作，如采购智能体自动寻源比价，客服智能体整合电话、邮件、社交媒体渠道
依靠MCP、a-to-a等新型协议实现互操作，如同今日互联网的TCP/IP

届时，商业流程将被彻底重构。谁能率先建立可学习、可进化的AI系统，谁就能构筑下一代竞争壁垒。

企业应立即采取的三项战略行动：

1. 优先“买”而非“建”

除非拥有顶级AI团队和长期投入意愿，否则应选择外部合作伙伴。重点考察供应商是否具备持续迭代能力，能否深度定制以适配工作流。

2. 让业务前线主导AI选型

放弃由IT或中央实验室主导的“技术驱动”模式，转而支持一线经理和超级用户发起试点。他们的实践经验是最可靠的筛选标准。

3. 将“学习能力”作为首要评估指标

选购AI工具时，优先考虑以下三项能力：

• 是否能记住上下文

• 是否能从反馈中改进

• 是否能嵌入现有工作流

那些只会生成内容但不会学习的工具，无论价格多低，终将沦为浪费。

结语：不是技术之争，而是价值之问

MIT NANDA报告中最发人深省的一句话是：“生成式AI鸿沟不是永久的，但跨过它需要不一样的选择。”

这不是一场关于谁拥有更大模型、更强算力的竞争，而是一场关于谁更能理解“真实问题”的较量。

真正的赢家不是追逐风口的人，而是沉下心来解决具体痛点的人；不是迷信技术参数的人，而是倾听一线声音的人；不是试图用AI取代人类的人，而是用AI释放人类潜能的人。

对于尚在观望的企业而言，现在仍是最后的机会。而对于已经跨越鸿沟的先行者，真正的挑战才刚刚开始——迎接智能体网络的到来，或将决定下一个十年的产业格局。

（全文共计约11,600字）

原文转录

加载中...