← 返回
2025-10

AI的商业鸿沟 | MIT NANDA报告 | 95%的企业AI投资没有回报

概述

——基于MIT NANDA《2025年商业AI现状报告》的专业访谈报告

引言:当AI投资遭遇“价值断层”

近年来,生成式人工智能(Generative AI)以前所未有的速度席卷全球企业。从营销文案自动生成到代码辅助编写,从客户服务自动化到合同智能审查,AI的应用场景不断扩展。然而,在这场看似全民参与的技术浪潮中,一个令人警醒的现象正在浮现:尽管企业在生成式AI上累计投入高达300至400亿美元,绝大多数组织却未能从中获得实质性回报。

麻省理工学院NANDA项目于2025年发布的《商业AI现状报告》,通过对300多个公开AI项目的系统分析、对52家组织代表的结构化访谈以及153位高管的问卷反馈,揭示了一个关键结论:95%的企业在生成式AI上的投资没有产生任何可衡量的价值回报,仅有5%的试点项目真正创造了数百万美元级别的经济价值。这一悬殊差距被研究者定义为“生成式AI鸿沟”。

本报告旨在深入解读该研究的核心发现,系统剖析以下三大核心问题:

1. 生成式AI鸿沟的真实形态是什么?它是否仅仅是资源分配不均的结果?

2. 为何大多数企业陷入“高采用、低转型”的困境?阻碍规模化落地的根本原因何在?

3. 那些成功跨越鸿沟的企业和初创公司做对了什么?是否存在可复制的战略路径?

通过还原报告中的实证数据与典型案例,本文将为企业提供一份基于现实洞察而非技术幻想的行动指南,帮助识别当前AI部署中的结构性盲区,并指出通向价值实现的关键转折点。

值得注意的是,这份报告颠覆了诸多流行认知。例如,AI鸿沟并非简单地表现为大企业与小企业之间的技术获取能力差异;相反,即便是拥有充足预算和技术团队的大型组织,也普遍面临AI工具无法融入实际业务流程的窘境。真正的分水岭不在于“有没有AI”,而在于“能不能用出价值”。

与此同时,研究进一步指出,跨过这道鸿沟的窗口期正在迅速关闭——未来18个月内,企业将逐步锁定具备持续学习能力的AI系统,一旦错过,可能面临代际落后的风险。因此,理解当前AI应用的成败逻辑,已不仅是技术选型问题,更是一场关乎组织适应力与战略前瞻性的竞争。

接下来的内容将围绕三个维度展开:首先描绘生成式AI鸿沟的具体表现及其背后的结构性失衡;其次深入探讨导致“试点多、落地少”的根本障碍,尤其是“学习差距”这一被广泛忽视的核心瓶颈;最后总结成功者的共性策略,提炼出三条可操作、可验证的战略原则,为仍在探索中的企业提供清晰的方向指引。

核心观点一:生成式AI鸿沟的本质是“高采用、低转型”

1. 鸿沟不是“有无之别”,而是“价值转化率”的断裂

传统观念认为,AI发展不平衡主要体现在资源占有层面——大企业能负担昂贵模型训练成本,中小企业只能依赖公共API或免费工具。但MIT NANDA报告明确指出,这种理解已经过时。如今几乎所有企业都能接触到生成式AI技术,无论是通过采购企业级解决方案,还是员工自发使用个人订阅服务(如ChatGPT Plus),AI的普及程度极高。

真正的鸿沟在于:即便广泛采用了AI工具,绝大多数企业仍未能将其转化为可持续的商业价值。换句话说,AI鸿沟的本质不是“有没有”,而是“会不会用”、“能不能创造回报”。

研究数据显示:

  • 80%的企业曾尝试通用大语言模型(LLM)的试点;
  • 近40%完成了初步部署;
  • 但对于定制化的企业级AI工具(包括自建或供应商提供),仅有5%最终成功落地并进入生产环境。

这意味着,尽管表面上看AI已被广泛采纳,但在从“实验”走向“运营”的过程中,绝大多数项目中途夭折,形成了典型的“死亡谷”现象。

2. 行业颠覆指数揭示结构性停滞:仅两个行业出现显著变革

为了量化不同行业的AI渗透深度,研究团队构建了“AI市场颠覆指数”,从五个维度评估各行业因AI引发的变化程度:

  • 头部企业市场份额波动
  • 2020年后成立的AI原生公司营收增长
  • 新AI商业模式的出现
  • 用户行为变化
  • 因AI引发的管理层变动

评分范围为0~5分,结果显示:

| 行业 | 得分 |

|------|------|

| 科技 | 3.8 |

| 媒体与电信 | 2.1 |

| 专业服务 | 1.5 |

| 医疗健康 | 0.5 |

| 金融服务 | 0.5 |

| 能源与材料 | 0.5 |

只有科技和媒体与电信两个行业得分超过1.5,其余七个主要行业几乎未发生结构性改变。

#### 科技行业的动态重构

在科技领域,已有新玩家挑战传统巨头。例如,代码编辑器Cursor正与微软Copilot展开直接竞争,其AI驱动的工作流正在重塑开发者的日常实践。开发者不再只是被动接受建议,而是与AI协同完成复杂任务,工作模式发生实质性转变。

#### 媒体与内容生态的迁移

媒体行业则表现出用户行为和商业模式的双重调整。AI生成内容的比例持续上升,广告投放策略也随之演化——平台开始依据AI内容特征优化推荐算法,传统媒体机构也不得不重新设计内容生产和审核流程以应对冲击。

#### 其他行业的“近零采用”状态

相比之下,能源与材料等行业虽有零星试点,但并未对供应链管理、生产调度或设备维护等核心环节产生实质影响。一位中型制造企业的CEO坦言:“LinkedIn上全是AI改变一切的帖子,但在我们的实际运营里,除了合同处理快了点,没什么根本的变化。”

这说明,AI的影响远未达到普遍预期中的“颠覆性”。多数企业仍停留在边缘性效率提升阶段,未能触及业务本质。

3. “影子AI经济”暴露正式系统的失效

另一个极具讽刺意味的现象是“影子AI经济”的兴起。调查显示:

  • 只有40%的企业官方采购了大语言模型订阅服务;
  • 但高达90%的员工在工作中使用个人AI工具,如自费购买ChatGPT会员、云端推理服务等。

这种反差背后反映的是企业级AI系统的严重脱节:

  • 个人工具灵活、响应快、交互自然,适合快速撰写邮件、会议纪要、PPT初稿等轻量任务;
  • 而企业推广的AI平台往往步骤繁琐、输出不稳定、缺乏上下文记忆,导致用户体验极差。

一位法务人员表示:“我宁愿用ChatGPT写法律意见草稿,也不愿用公司花几十万买的合同分析系统,因为它每次都要重新输入背景信息,还记不住我的修改偏好。”

这表明,员工并非抗拒AI,而是拒绝无效的AI。当正式系统无法满足真实工作需求时,员工便会绕开组织架构,自行寻找替代方案。这种“地下采用”虽然提升了个体效率,却带来了数据安全、合规性和知识孤岛等一系列新问题。

4. 投资错配加剧鸿沟:预算集中于“可见成果”,忽视高ROI后台场景

研究还发现,企业在AI预算分配上存在明显误区。当被要求模拟分配100美元的AI预算时,约70%的资金流向销售与营销部门,主要用于:

  • 自动生成营销邮件
  • 客户线索评分
  • 社交媒体内容创作

原因在于这些领域的成果易于量化——回复率、点击率、Demo预约数量等指标可以直接对接董事会KPI,便于向上汇报。

然而,真正具有高投资回报率(ROI)的潜力场景却被严重低估,尤其是在后台职能部门:

  • 法务:合同审查自动化可节省大量人工时间
  • 采购:供应商比价、条款合规检查可通过AI加速
  • 财务:发票处理、异常交易检测具备高度重复性

一位财富1000强制药公司的采购副总裁抱怨道:“我想引入一个AI工具帮团队提速,但怎么证明它的价值?难道跟CEO说‘我们让科学家更快拿到试剂’吗?这跟营收没有直接关系,根本说不通。”

结果是,企业宁愿把钱花在“看得见”的前端,也不愿投入“看不见”但更具长期效益的后台。这种短视的投资逻辑进一步拉大了价值创造的差距。

核心观点二:阻碍AI规模化的根本原因是“学习差距”

1. 真正的瓶颈不在基础设施或人才,而在“不会学习的AI”

长期以来,业界普遍将AI落地困难归因于三类外部限制:

  • 缺乏算力基础设施
  • 数据隐私与监管障碍
  • AI人才短缺

但MIT NANDA报告通过高管调研得出截然不同的结论:阻碍AI规模化的核心因素并非上述任何一项,而是“学习差距”(Learning Gap)——即现有AI工具不具备持续学习、积累经验、适应具体场景的能力

在52家组织的反馈中,AI试点失败的主要原因排名如下:

1. 用户不愿采用新工具(排名第一)

2. 模型输出质量不可靠(紧随其后)

而“质量担忧”的根源正是AI缺乏记忆与进化机制。员工可以容忍ChatGPT偶尔出错,因为它是辅助工具;但在企业环境中,AI若在合同审查、客户数据分析等高风险任务中犯错,则可能导致重大损失。

2. 企业AI工具的四大痛点源于“无记忆”设计

研究总结出用户对企业级AI工具最不满意的四个特征,全部指向“学习能力缺失”:

在特殊场景下容易崩溃且无法调整

许多AI系统基于通用模型微调而成,面对非标准输入时表现脆弱。例如,某律所采购的合同分析工具,在遇到非常规条款时频繁误判,且无法通过反馈进行修正。

无法深度集成到个性化工作流中

工具功能固定,难以根据组织特有的审批流程、文档格式或协作习惯进行配置,导致“水土不服”。

每次使用都需重复输入上下文

当前多数AI系统不具备持久记忆,用户每次交互都必须重新说明背景,极大降低效率。

无法从用户反馈中学习改进

即使用户多次纠正错误,系统也不会记住这些教训,下次依然重复相同错误。

一位公司法务举例:“我处理一份并购合同时指出某个风险点,系统没识别出来。我以为它会记住,结果下一次同样的问题又出现了。我怎么可能信任这样的工具?”

3. 复杂任务依赖上下文连贯性,碎片化AI难以胜任

进一步的数据表明,AI的适用性与任务复杂度密切相关:

  • 对于简单任务(如写邮件、做基础分析),70%用户愿意使用AI;
  • 但对于复杂、跨周期的任务(如项目管理、客户关系维护),90%用户宁愿求助同事而非AI。

原因在于,复杂任务需要系统具备上下文延续能力——能够记住过往沟通、理解角色职责、跟踪进度变化。而当前大多数AI工具只能处理孤立请求,无法维持长期对话或任务链条。

这也解释了为什么AI尚未取代人类协作的核心地位。人们需要的不是一个“问答机器人”,而是一个能像资深助理一样“记得事、懂规矩、会成长”的伙伴。

4. 解决路径:向“智能体AI”(Agentic AI)演进

研究者提出,突破学习差距的关键在于转向“智能体AI”(Agentic AI)。这类系统具备以下特性:

  • 自主执行任务,无需持续人工干预
  • 拥有持久记忆,能够积累用户偏好和历史决策
  • 支持迭代学习,可根据反馈不断优化表现
  • 可协调多步骤工作流,实现端到端自动化

已有成功案例验证其潜力:

  • 客服智能体:从接收客户咨询开始,全程跟进问题解决,无需转接人工;
  • 财务智能体:监控常规交易流,自动审批符合规则的报销单据,仅将异常情况提交审核;
  • 采购智能体:跟踪供应商报价变化,主动提醒续约节点,甚至发起比价谈判。

这些系统之所以成功,正是因为它们解决了“记不住、学不会”的根本痛点,成为真正嵌入业务流程的“数字员工”。

5. AI工具四象限分类:未来属于“高定制+高学习”组合

为帮助企业识别真正有价值的AI工具,报告提出一个二维分类框架:

| 维度\类型 | 低学习能力 | 高学习能力 |

|----------|------------|------------|

| 低定制化 | 第一类:Copilot、GPT包装工具
• 易用但不灵活
• 适用于通用场景 | 第二类:带记忆的ChatGPT
• 能记住上下文
• 但无法修改工作流 |

| 高定制化 | 第三类:企业自建AI工具
• 表面贴合需求
• 实际脆弱易崩 | 第四类:智能体工作流、垂直SaaS
• 深度定制
• 持续学习
• 跨越鸿沟方向 |

显然,第四类工具才是未来发展方向。它们不仅适配特定业务流程,还能随着时间推移变得越来越聪明,形成正向反馈循环。

核心观点三:成功者的共同选择——买、前线主导、重学习能力

1. 优先“买”而非“建”:合作模式成功率翻倍

报告显示,AI项目的成功落地率存在显著差异:

  • 外部合作项目:67%成功落地
  • 企业自建项目:仅33%成功,相差整整一倍

失败的自建项目普遍存在以下问题:

  • 过度关注技术参数,忽视实际可用性
  • 花费数月调试模型,却发现与业务流程不匹配
  • 上线后缺乏持续维护,工具逐渐退化失效

而成功的采购案例则展现出完全不同的逻辑。

#### 案例:金融服务公司转向专业供应商

一家年营收50亿美元的金融企业最初试图自建客户风险评估AI系统,历时三个月毫无进展。随后转向一家专注于金融风控的AI供应商,对方已具备成熟的风险建模能力,仅需对接客户数据即可启动试点。两个月内完成部署,每年节省100万美元外包成本。

关键在于:买的是“解决方案”而非“软件”。供应商不仅提供技术,更承担起流程适配、持续迭代的责任,成为企业的延伸团队。

#### 合作不是终点,而是起点

成功的买家不会仅凭Demo就签约,而是采取更深度的合作方式:

  • 邀请供应商参与内部工作坊,共同梳理业务流程
  • 在试点阶段出现问题时,不急于终止,而是联合排查原因
  • 建立定期反馈机制,推动模型每周迭代优化

例如,某零售企业与AI供应商合作客服自动化项目,初期准确率仅为60%。企业未解约,而是组织客服团队系统整理常见问题及正确回答,交由供应商用于训练。经过三个月迭代,准确率提升至90%,最终每年节省200万美元外包费用。

这表明,成功的AI部署本质上是一种协作过程,而非一次性采购行为

2. 让业务前线主导,而非中央实验室闭门造车

许多企业推行AI的方式是由IT部门或“AI创新实验室”牵头,统一选型、集中推广。但这种方式往往失败率极高,原因在于:

  • 实验室不了解一线真实痛点
  • 所选工具过于技术导向,缺乏实用性
  • 推广过程强制推行,员工抵触情绪强

相比之下,成功企业普遍采用“自下而上”的推进策略:

  • 由一线经理或“超级用户”发起试点
  • 工具选择基于实际工作需求
  • 成效显著后再向上申报推广

#### 案例:制造企业采购经理自主引入合同工具

某制造企业采购部门经理发现团队每天耗费两小时整理供应商合同,遂自行寻找一款合同自动化AI工具进行试点。效果良好后上报总部,最终获得全面推广。

#### 案例:识别“超级用户”作为测试先锋

有的企业专门筛选那些已在日常工作中熟练使用ChatGPT的员工,邀请他们参与新工具测试。这些人清楚什么样的AI真正提效,能有效规避“好看不好用”的陷阱。

这种方法的优势在于:

  • 决策贴近真实业务场景
  • 试点见效快,说服力强
  • 推广阻力小,接受度高

数据显示:

  • 中型企业从试点到全量部署平均仅需90天
  • 大型企业若由中央实验室主导,平均耗时超过9个月,相差三倍

速度差异的背后,是组织决策机制的根本不同。

3. 关注后台ROI:减少外部支出而非裁员

尽管大多数企业将AI预算投向前端销售与营销,但真正实现高回报的案例多集中在后台职能部门。成功企业的一个共性是:紧盯后台自动化带来的成本节约,而非追求裁员式降本

典型回报来源包括:

• 替代客服外包:年节省200万~1,000万美元

• 减少外部创意代理费用:AI生成基础素材,降低对外依赖

• 优化风控流程:AI完成初步筛查,减少第三方审计支出

更重要的是,这些企业几乎没有大规模裁员。AI的作用不是替代人力,而是解放重复劳动,使人转向更高价值的工作

  • 客服人员从接听简单咨询,转为处理复杂投诉与情感沟通
  • 采购专员从整理合同,变为参与供应商谈判与流程优化
  • 法务人员从初审标准化条款,升级为参与战略合同设计

这种转型实现了双赢:企业降低成本,员工提升职业价值,避免了因AI引发的组织动荡。

总结与启示:跨越鸿沟的三大战略选择

MIT NANDA报告最终提炼出一条清晰路径:生成式AI鸿沟并非不可逾越,但它要求企业做出不同于主流做法的选择。那些仍在“高采用、低转型”泥潭中挣扎的企业,仍有调整空间,但窗口期正在迅速收窄——研究预测,未来18个月内,企业将基本完成AI工具的选型与锁定。

一旦数据流程与某一AI系统深度绑定,切换成本将急剧上升。例如,若某AI已学习了一年内的合同模板、审批规则和用户偏好,更换新系统意味着重新训练所有知识,代价高昂。目前微软、OpenAI等巨头已在为其工具添加持久记忆功能,生态壁垒正在形成。

展望更远未来,AI将进入“智能体网络”(Agentic Web)时代:

  • 不再是单一AI工具,而是一群具备自主决策能力的智能体
  • 能跨平台、跨组织协作,如采购智能体自动寻源比价,客服智能体整合电话、邮件、社交媒体渠道
  • 依靠MCP、a-to-a等新型协议实现互操作,如同今日互联网的TCP/IP

届时,商业流程将被彻底重构。谁能率先建立可学习、可进化的AI系统,谁就能构筑下一代竞争壁垒。

企业应立即采取的三项战略行动:

1. 优先“买”而非“建”

除非拥有顶级AI团队和长期投入意愿,否则应选择外部合作伙伴。重点考察供应商是否具备持续迭代能力,能否深度定制以适配工作流。

2. 让业务前线主导AI选型

放弃由IT或中央实验室主导的“技术驱动”模式,转而支持一线经理和超级用户发起试点。他们的实践经验是最可靠的筛选标准。

3. 将“学习能力”作为首要评估指标

选购AI工具时,优先考虑以下三项能力:

• 是否能记住上下文

• 是否能从反馈中改进

• 是否能嵌入现有工作流

那些只会生成内容但不会学习的工具,无论价格多低,终将沦为浪费。

结语:不是技术之争,而是价值之问

MIT NANDA报告中最发人深省的一句话是:“生成式AI鸿沟不是永久的,但跨过它需要不一样的选择。”

这不是一场关于谁拥有更大模型、更强算力的竞争,而是一场关于谁更能理解“真实问题”的较量。

真正的赢家不是追逐风口的人,而是沉下心来解决具体痛点的人;不是迷信技术参数的人,而是倾听一线声音的人;不是试图用AI取代人类的人,而是用AI释放人类潜能的人。

对于尚在观望的企业而言,现在仍是最后的机会。而对于已经跨越鸿沟的先行者,真正的挑战才刚刚开始——迎接智能体网络的到来,或将决定下一个十年的产业格局。

(全文共计约11,600字)