120. 小鹏新上任的刘先明首次访谈：Language是毒药、拆掉L、简单即美、换帅、小鹏的AI转型 - 张小珺Jùn｜商业访谈录

节目

张小珺Jùn｜商业访谈录

嘉宾

刘先明

日期

2025-11

时长

109 min

查看原始内容 →

报告概述

本报告基于对小鹏汽车自动驾驶中心负责人刘先明的首次深度访谈内容，系统性地呈现了其在人工智能与自动驾驶领域所秉持的核心理念、技术演进路径及组织变革逻辑。作为一位拥有伊利诺伊大学厄本那-香槟分校（UIUC）计算机科学博士学位，并曾在Facebook、Cruise等全球顶尖科技企业任职的资深工程师，刘先明的职业轨迹深刻体现了“使命驱动型”技术人才的典型特征——从早期参与海地地震灾后重建的卫星图像分析项目，到投身于能真正拯救生命的自动驾驶技术研发，其决策始终围绕着“改变人类生活”这一根本价值导向。这种强烈的使命感不仅塑造了他的职业选择，更成为其在小鹏推动激进技术变革的根本动力。

本次访谈揭示了一个关键的战略跃迁：小鹏汽车的本质并非传统意义上的“智能出行解决方案提供商”，而是一家致力于构建“物理世界中的AI系统”的综合性AI企业。这一认知转变标志着公司从“造车”向“构建物理智能体”的范式升级，其核心在于打造“芯片大脑”与“与物理世界交互的设备/代理”（device or agent）的完整闭环。为实现这一目标，刘先明主导了一系列颠覆性的技术架构重构，包括自2024年起逐步拆除激光雷达、规控规则乃至语言模块（Language Module），其背后逻辑直指一个核心命题——当数据规模与算力达到临界点时，最有效的路径并非叠加复杂模块，而是通过极致简化来释放模型潜能。这一思想贯穿于其从Facebook到Cruise再到小鹏的整个职业生涯，形成了一条清晰的技术哲学主线：“当你拥有足够大的数据与算力时，最有效的路径不是添加更多复杂模块，而是不断拆掉冗余，回归最原始的感知-决策-执行循环。”

报告进一步深入剖析了这一战略转型的具体实施路径，涵盖从“分—合—分”的组织架构演进、高达45亿元人民币的年度研发预算承诺，到VLA 2.0模型的训练方法论与“涌现效应”的实证验证。特别值得注意的是，刘先明所倡导的“去语言化”（Language is poison）策略，不仅是对当前主流多模态大模型范式的挑战，更是对AI本质的一次重新思考：将语言视为一种低效的中间监督信号，其离散性与连续控制空间的不匹配严重制约了数据使用效率。通过直接以视觉与自然语言指令联合输入，输出连续动作信号，小鹏正在探索一条通往真正“物理AI”的新通路。最终，这场变革的本质远超技术层面，它是一场关于组织韧性、领导勇气与系统思维的全面考验，其成功与否将深刻影响中国在全球自动驾驶与通用人工智能竞赛中的领先地位。

一、个人职业轨迹与核心决策逻辑

刘先明的职业发展路径

刘先明的职业生涯始于对基础科学的严谨追求。他于2016年从美国伊利诺伊大学厄本那-香槟分校（UIUC）获得计算机科学博士学位，其研究方向聚焦于传统计算机视觉（Computer Vision）与机器学习（Machine Learning）。这一时期的学术背景为其奠定了坚实的理论基础，使其能够深刻理解算法的本质与局限。在博士阶段，他便已开始接触并实践当时尚处于萌芽状态的深度学习技术，尽管那时“AI”这一概念尚未被广泛接受，他所从事的研究仍被视为“比较传统的技术展”。这种早期的学术训练，使他具备了超越表象、洞察问题底层机制的能力，这成为其日后在工业界做出颠覆性决策的重要心智工具。

毕业后，刘先明并未选择进入学术界，而是毅然投身于工业界，这一决定源于一次深刻的职场启蒙。他在Facebook实习期间，曾受到一位部门主管的启发，该主管曾提出一句极具震撼力的问题：“有多少人有机会改变十亿人的生活？”这句话瞬间点燃了他内心深处的使命感，让他意识到，相较于发表论文，将技术应用于解决真实世界的重大问题，更能体现个人价值。正是这一信念，促使他放弃了学术道路，转而加入Facebook，开启了其在顶级科技公司的职业生涯。这一选择并非偶然，而是其价值观与职业理想高度契合的结果。

在Facebook期间，刘先明最初加入了名为Connectivity Lab的跨学科实验室，该实验室专注于高空无人机站、无人机激光通信及地理信息系统（GIS）等前沿项目。这段经历让他接触到软硬件结合的复杂系统工程，极大地拓宽了其技术视野。尤为值得一提的是，他在Facebook工作期间，曾与当时正处在巅峰期的知名AI科学家开明（可能指杨立昆Yann LeCun）共事。据刘先明回忆，开明在当时几乎包揽了Facebook AI Research（FAIR）所有主要研究论文的构思与贡献，其强大的创造力和前瞻性思维给刘先明留下了极为深刻的印象。面对如此天才，刘先明自嘲道：“你刷paper肯定刷不过他嘛。” 这种在顶尖环境中成长的经历，不仅锻炼了他的技术能力，更培养了他对“伟大创新”的敬畏与追求，为他后来在Cruise和小鹏推动革命性技术变革埋下了伏笔。

职业选择背后的驱动力

刘先明的职业选择并非单纯基于技术兴趣或薪资待遇，其深层驱动力是一种根植于“使命驱动型人格”的强烈社会责任感。他自述其做事风格具有强烈的“mission-driven”特质，即以解决重大现实问题为内在驱动力。这种动机并非抽象的理想主义，而是建立在一系列具体且富有情感冲击力的真实事件之上。例如，在Facebook工作期间，他参与了海地地震后的灾后重建项目，利用卫星图像分析人口分布和建筑损毁情况。该项目要求在极短时间内完成任务，以便红十字会能够及时展开救援。刘先明团队仅用不到两天时间便完成了分析，这一成果直接支持了人道主义救援行动。他坦言：“所以就是呃整个我这个人就有点轴，就是想去做这种有意思的事，或者说有点使命感的事。” 这种将技术能力用于拯救生命、改善人类福祉的体验，深刻塑造了他的人生观与职业观。

这种使命感在决定投身自动驾驶领域时达到了顶峰。他回忆道，自己之所以选择自动驾驶，是因为一段关于卡车司机因疲劳驾驶而闭眼的宣传片深深触动了他。他意识到，这项技术能够真正拯救生命，改变无数家庭的命运。他明确表示：“那个时候觉得说做这件事情是有意义的，真的是能改变人的生活，能去救人，所以决定要去做自动驾驶。” 这种将技术与生命安全紧密联系的价值判断，使得自动驾驶对他而言，远非一项商业产品或技术挑战，而是一项关乎人类福祉的崇高事业。正是这种超越功利的纯粹动机，支撑着他敢于在小鹏进行一系列高风险、高争议的技术决策，因为他坚信这些决策最终将服务于一个更大的、更具人文关怀的目标。

从Facebook到Cruise再到小鹏的跃迁逻辑

刘先明的职业跃迁路径清晰地展现了其对“技术理想主义”与“商业可行性”之间平衡的持续探索。从Facebook到Cruise的转变，源于他对“逆袭故事”的强烈向往。当时，Cruise虽被普遍认为是行业“老二”，但其“从第二名逆袭”的叙事极具吸引力，这与刘先明内心追求宏大目标的愿景高度契合。然而，初入Cruise后，他很快发现现实与预期存在巨大落差。他坦承：“啊，有几个想的不一样的地方，第一个地方呢，就是当时去的时候，Cruise技术站比我想的还要烂，还要差，哈哈。” 这种技术栈的落后与商业化落地的巨大挑战，反而成为他宝贵的学习机会。在Cruise，他深刻领悟到“数据驱动”与“持续学习机器”（Continuous Learning Machine）的核心价值，这一理念至今仍是其技术路线图的基石。

离开Cruise的关键转折点在于其“顺风顺水”却突然停滞的状态。刘先明认为，这种戛然而止的结局，恰恰证明了在创业公司中，即使短期成功也难以保证长期可持续性。这促使他反思：若想真正推动自动驾驶事业，必须寻找一个具备长期战略定力与资源保障的平台。此时，小鹏汽车的出现提供了完美的答案。2024年初，他与小鹏创始人“大师兄”在F/K办公室进行了一次约一小时的深入交流。这次对话直接促成了其入职决定，其核心原因在于双方在思想层面达成了惊人的一致。当“大师兄”提出“我们如何才能在未来一代中彻底甩开当前对手？”这一极具前瞻性和挑战性的问题时，刘先明立刻意识到，这正是自己多年来苦苦追寻的答案。他形容道：“所以我们当时就就是这个问题去聊，会发现其实有的时候不是我在去说服他说。哎，我们要去做这个事情，而是其实我们想的同一个问题。” 这种“灵魂共振”般的共识，使得他无需犹豫，当场便向HR表示“准备offer吧”，展现了其决策的果断与坚定。

加入小鹏的决策过程

刘先明加入小鹏的决策过程，堪称一场由共同愿景驱动的“双向奔赴”。2024年1月，他与“大师兄”在办公室进行了首次面对面的深度对话，这次交流成为其职业生涯的分水岭。在此之前，他仍在犹豫，但这次谈话彻底改变了其心态。他强调，此次对话并非传统意义上的面试，更像是两位志同道合的探索者在探讨一个宏大的未来蓝图。他评价“大师兄”为“非常非常呃坦诚的一个人，而且又是个一个技术宅男，技术直男”，这种真诚与技术深度的结合，让他感到极度信任。更重要的是，两人讨论的核心问题——“如何在未来一代中彻底甩开当前对手”——精准击中了刘先明内心最深的渴望。他指出：“我有一种感觉就是他其实需要找到一个人能去理解他，然后把这个事情做出来，而我需要找到的就是需要一个支持我、理解我的老板，把这个事做出来。” 这种双向的需求与匹配，使得加盟小鹏不仅仅是一份工作，更是一次共同开创历史的契约。

这一决策的合理性，建立在对行业格局的深刻洞察之上。刘先明认为，自动驾驶的未来竞争，本质上是“数据闭环能力”的竞争。只有主机厂，如小鹏，才拥有可控的数据链路和真实的用户场景，这是第三方无法复制的护城河。他明确指出：“那如果还是按沿着刚才那个套路，就是我们如果认为 physical AI 和自动驾驶它的未来趋势。就是大规模的数据，然后快速的 iteration 去反馈，然后 infrastructure 建立这个整个数据闭环体系的话。那我一定要去找的一个地方就是一个主机厂，因为只有主机厂才有这样的数据，才可有可控的数据链路。” 因此，加入小鹏，不仅是追随一个领导者，更是选择了一个能够实现其技术理想的战略支点。2024年3月，他正式加入小鹏，开启了其职业生涯的新篇章。

原话摘录：“跟大师兄聊了一个小时之后出来就跟 HR 说说，哎，准备 offer 吧，就就直接来了。”

原话摘录：“我们当时就就是这个问题去聊，会发现其实有的时候不是我在去说服他说。哎，我们要去做这个事情，而是其实我们想的同一个问题。”

二、小鹏汽车的战略转型：从“自动驾驶企业”到“物理AI企业”

战略转型的核心命题

小鹏汽车的战略转型，其核心并非简单的业务拓展，而是一次根本性的认知升级。刘先明在访谈中反复强调：“小鹏本质上是一家 AI 企业。” 这一论断的提出，源于对小鹏业务版图的全面审视。小鹏的布局远不止于整车制造，其触角延伸至机器人、飞行汽车以及芯片研发等多个前沿领域。这种多元化的战略布局，清晰地表明其核心竞争力并非单一的“自动驾驶”功能，而是构建一个能够与物理世界进行深度交互的“AI系统”。因此，小鹏的定位应从“智能出行解决方案提供商”提升至“物理世界中的AI系统构建者”，其核心能力在于打造“芯片大脑”与“与物理世界交互的设备/代理”（device or agent）。

这一战略定位的转变，意味着小鹏的竞争壁垒不再局限于某一项特定技术，而是建立在一个完整的、可扩展的“物理AI”生态系统之上。该系统以强大的计算芯片为“大脑”，以车辆、机器人等实体设备为“身体”，并通过海量的真实世界数据形成一个自我进化、持续学习的闭环。这种模式的优势在于，它能够将AI能力从虚拟的数字世界，无缝迁移至复杂的物理世界，从而创造出前所未有的应用价值。例如，一辆搭载了先进物理AI系统的汽车，不仅能完成导航和避障，还能像人类一样理解复杂的交通情境，甚至预测其他交通参与者的行为，实现真正的“智能驾驶”。

转型的三大支柱

#### 1. 思维方式的重塑（Mindset Shift）

小鹏的战略转型首先体现在思维方式的彻底革新。刘先明指出，过去以KPI为导向的研发模式，如“金屁股”（老板坐车体验好就推给用户）和“白金屁股”（老板坐车体验好就推给用户），虽然能带来短期的用户体验提升，但本质上是一种短视的、非技术驱动的“产品思维”。这种模式将优化目标局限于表面的用户体验指标，忽视了底层技术的突破与迭代。

为了实现真正的技术跃迁，小鹏必须转向一种“技术驱动”的全新范式。这意味着优化目标的范围被极大扩展，从传统的接管率、用户体验等短期指标，延伸至模型性能、数据效率、系统可扩展性等长周期、深层次的技术指标。刘先明强调：“你要去接受的一个事情就是你的优化目标不再单纯的只是你的产品体验，然后你除了有产品体验之外，你还有更底层的技术的变化，这些都是你最终的目标，这样才能真正的去往前推进。” 这种转变要求团队成员具备长远的眼光，能够容忍失败、延迟与回退，因为技术进步往往伴随着不可预测的试错过程。这种“拥抱不确定性”的心态，是推动技术从量变到质变的关键。

#### 2. 组织架构的重构（Structural Evolution）

为支撑上述思维方式的转变，小鹏的组织架构也经历了从“分”到“合”再到“分”的动态演进。最初的“分”阶段，各业务线（如机器人、车、芯片）独立运作，导致资源分散，难以形成合力。当前的“合”阶段，则是集中资源，合力攻坚，旨在打造一个统一的“物理AI基座模型”。这一阶段的核心任务是构建强大的基础设施（Infra），包括大规模的数据处理平台、高效的训练集群和完善的软件分析链路，为模型的持续迭代提供坚实支撑。

未来的“分”阶段，则是在基座模型成熟后，赋能多个应用场景，形成“应用爆发”。这种“分—合—分”的演进路径，确保了公司在不同发展阶段都能保持最优的组织效率。刘先明描述了其组织的极致扁平化特征：“拒绝层级汇报，主张‘问题直达’。” 所有问题均可直接沟通，无固定例会，问题出现即刻召开会议。这种高效的沟通机制，极大缩短了决策链条，提升了响应速度。他举例称，与“大师兄”的沟通频率极高，近一个月内已多次讨论量产计划、海外部署、泛化性等问题，这种高频互动是推动战略快速落地的关键。

#### 3. 资源投入与人才策略

战略转型的成功离不开巨额的资源投入与独特的人才策略。小鹏已明确宣布，2025年将投入45亿元人民币用于自动驾驶与AI研发，目前该预算已基本完成分配。这笔资金的投入，是其“物理AI”战略的物质保障，确保了在基础设施建设、大规模数据采集与模型训练上的持续领先。

在人才策略上，小鹏采取了“双轮驱动”的模式。一方面，积极引入年轻人才，因其思维“新鲜”，能跳出既有框架思考问题，带来“brain fresh new brain”效应。另一方面，小鹏也面临着与字节跳动、DeepSeek等头部公司的激烈人才竞争。然而，其差异化优势在于“不依赖外部大模型”、“自主构建图灵模型”等理念，这吸引了那些希望在核心技术上实现自主可控的顶尖人才。这种对“自主性”的强调，构成了其人才吸引力的独特标签。

原话摘录：“所以我们在做一件事情，就是云端的工厂也好，还是什么，本质上来说就是我们都知道这个如果 skilling 是 work 的，这个 skinning 是 work 的，我需要给它更多的参数。更多的数据量来去 train 那我的车端的硬件一定是支持不了的，那我把它拿到云端来去做，做一个巨大的模型，再通过蒸馏的方式或者是量化减脂部署的方式。量化减脂蒸馏方式部署到车上，那就变成了一个，你有一个 factory 这个 factory 一旦训练好了之后，它就会不停的去 generate 不同的模型，可以 deploy 到不同的硬件上面的这个模型，来去完成软件部署。”

三、核心技术架构演进：从规则系统到端到端再到“去语言化”VLA

技术演进的四个阶段

|------|----------|----------|----------|

| VLA 3.0+ | 2024–至今 | 多模态融合 + 去语言化 + 世界模型 | 小鹏VLA 2.0 |

这一演进历程清晰地勾勒出自动驾驶技术从“规则驱动”到“数据驱动”的根本性转变。第一代（Software 1.0）完全依赖于手工设计的规则，如激光雷达点云聚类和数学优化的规控算法，其性能上限受限于规则的完备性。第二代（Software 1.5）尝试融合机器学习模型，但依然严重依赖规则，形成了“一半模型一半规则”的混合架构，其瓶颈在于规则代码本身限制了模型的上限。第三代（SOFA 2.0）则迈出了革命性的一步，采用纯神经网络的端到端架构，实现了从传感器输入到控制指令输出的直接映射，为后续的深度学习时代奠定了基础。而第四代（VLA 3.0+）则标志着小鹏当前的技术前沿，其核心特征是“去语言化”与“世界模型”的深度融合，旨在构建一个能真正理解物理世界的智能体。

关键技术变革路径

#### 1. 拆除激光雷达与规控规则

刘先明在2024年至2025年期间，主导了对激光雷达系统和规控规则的拆除。这一决策并非一时冲动，而是基于对现有技术局限性的深刻洞察。激光雷达系统成本高昂，维护复杂，且在城市复杂场景下存在性能瓶颈。更重要的是，规控规则体系导致系统僵化，难以应对海量的“长尾场景”（corner case），如宠物、流浪汉、突发障碍物等。拆除这些组件，使得系统整体得以简化，模型训练效率显著提升。刘先明指出：“所以从去年到今年，拆了激光雷达，拆了，拆了规控规则。” 这一“极致简化”的策略，其有效性已在实践中得到验证。

#### 2. 拆除语言模块（Language Module）——最激进的技术决策

如果说拆除激光雷达和规控规则是“减法”，那么拆除语言模块则是“加法”——它直接挑战了当前AI领域的主流范式。刘先明将语言模块称为“毒药”，并直言：“为什么 AI 的进展都是要不断的拆掉更多冗余的东西？这个稍微说一点可能引战的话，就是呵呵，你说。” 他的理论依据在于，语言是一种低效的表达形式，尤其在连续控制空间中。语言的离散性（tokenization）与物理世界的连续信号不匹配，且作为中间监督信号会引入人工标注与质检环节，严重降低数据使用效率。

实证证据显示，语言模块已成为训练过程中的瓶颈。实验表明，增加语言输入反而使推理速度下降数百倍。为此，小鹏采用了更为激进的方案：直接以“Vision + Language”联合输入，跳过语言中间层，直接输出连续的动作信号。这一做法的核心在于，让模型直接从视觉和语言指令中学习如何“思考”和“行动”，而非通过语言这一中介。刘先明解释道：“我们就直接，那既然这样想明白这个事情之后呢，我们就做了一个尝试，就是我干脆全都拆掉好了。” 这种“去语言化”的设计，是其技术哲学的集中体现。

#### 3. 世界模型（World Model）的构建

世界模型是小鹏技术架构的终极形态，其定义为一个能够理解并推演物理世界运行规律的生成式模型。它并非一个简单的“输入-输出”映射，而是一个“理解世界-生成动作”的因果推理过程。其核心原理是，通过训练一个强大的模型，使其能够模拟物理世界的动态变化，从而在真实世界中做出更优的决策。

小鹏的实现方式是，以VLA架构为基础，去除生成与解码部分，保留中间的推理能力。训练完成后，该模型可直接输出动作，无需额外解码。这种设计使得模型能够“看到”未来的可能性，从而做出更符合物理规律的决策。例如，在遇到复杂路口时，模型不仅能识别当前的交通信号，还能推演其他车辆和行人的潜在行为，提前规划最优路径。这与传统端到端模型“只看当下”的局限性形成了鲜明对比。

原话摘录：“所以你们作为输入只输入的是 VL 联合的这个语料是吗？还是说是 vision 的语料和 l 的语料，好像没有 l 的语料对吧？没有纯粹 l 的语料，我们输入的基本就是 VL 联合的语料。”

四、VLA 2.0的技术实现细节与训练方法论

模型架构设计

小鹏VLA 2.0的模型架构设计遵循了“去语言化”的核心原则。其输入为视觉信号（camera feed）与自然语言指令（text prompt）的联合输入，但输出并非离散的token序列，而是连续的控制信号（如加速度、方向盘转角）。这一设计确保了数据流的畅通无阻，避免了任何语言中间表示。刘先明强调：“就是说v和l一起输入，嗯，不单独输输入l，对。” 这种架构摒弃了传统VLM中将视觉信号转换为语言token再进行解码的低效流程，直接将多模态信息映射到连续的动作空间，从而实现了更高的数据使用效率和推理速度。

训练流程与数据策略

VLA 2.0的训练流程建立在海量真实数据的基础之上。目前，训练一个模型平均使用27万至30万小时的纯视频数据，其中超过99%为真实道路数据，仿真数据仅用于补充极端场景。数据获取机制极为智能，通过“影子模式”（shadow mode）自动识别未见过的corner case，并利用用户接管数据反向触发数据采集。此外，还建立了数据分布分析系统，动态判断哪些数据应优先采集，从而形成一个高效、自洽的数据闭环。

模型训练的“涌现效应”

VLA 2.0的成功，最有力的证明来自于“涌现效应”的实证。当模型在足够大的数据规模下训练时，其性能会自发地、超出预期地提升。刘先明指出：“拆掉语言模块后，模型在红绿灯、待转区等复杂场景表现超出预期。” 这一现象表明，当数据量足够大时，模型能够自行解决此前被认为“不可能”的问题。衡量这一效果的核心北极星指标是XL（eXtended Learning），它反映了模型在大规模数据下的持续学习能力。这一发现印证了其核心信条：“当你拥有足够大的数据与算力时，最有效的路径不是添加更多复杂模块，而是不断拆掉冗余，回归最原始的感知-决策-执行循环。”

原话摘录：“所以简单的事情就是有一些，大家一直觉得说一个技术突破是不是背后有很多的故事，有很多的推理很多时候就是你直觉上觉得他是对的，然后你敢于去踏出那一步去做这件事，并且。”

五、组织文化与领导力风格：扁平化、高强度与“头铁”精神

扁平化组织结构

小鹏的组织文化以极致的扁平化为核心。刘先明明确表示：“拒绝层级汇报，主张‘问题直达’。” 这种管理哲学打破了传统企业的科层制，使得信息传递更加高效。所有问题均可直接沟通，无固定例会，问题出现即刻召开会议。这种“问题直达”的机制，极大缩短了决策链条，提升了响应速度。刘先明与“大师兄”的沟通频率极高，近一个月内已多次讨论量产计划、海外部署、泛化性等问题，这种高频互动是推动战略快速落地的关键。

高强度工作文化

小鹏的工作节奏被形容为“7×24小时”，虽为玩笑，但反映了其真实状态。刘先明个人作息为晚上工作至凌晨两三点，早上七八点起床，睡眠时间极少。这种高强度的工作模式，源于对技术突破的紧迫感。他认为，当看到一个确定性很强的技术路径时，所有人首要的选择就是加速验证，而不是等待。这种“加速验证”的文化，使得团队能够在短时间内完成大量迭代，从而快速逼近技术边界。

“头铁”领导风格

“头铁”是刘先明领导风格的精髓，意指敢于做出高风险、高争议决策，并坚定执行。其典型行为包括坚决拆除激光雷达、规控规则、语言模块等已被广泛接受的技术组件。在团队内部有强烈反对声音时，他仍坚持推进。他曾因压力大而拍桌子、发火，但事后反思为必要代价。这种“头铁”精神，其心理机制在于坚信“简单即美”，认为真正的突破往往来自极致简化。他坦言：“我其实一直说跟团队内部去说，就是我们要去做一个团队，这个团队要勇于去破除你自己之前做过成功的。事情，然后去 explore and know and know 就是你不知道的这些事情。” 这种敢于打破“成功经验”的勇气，是其领导力的核心。

原话摘录：“所以如果没有头铁的性格，或者没有非常 hands on 的风格的话，很多事情是推不动的，嗯，也不太可能看到结果。”

六、未来展望与战略挑战

明确路径与模糊地带

小鹏的未来路径是明确的：构建一个输入为连续传感器信号、输出为连续控制动作的物理AI模型，通过大规模数据与算力实现scaling up，并以世界模型为核心，支持多模态、多场景泛化。然而，其模糊地带同样显著。首先是scaling极限在哪里？何时达到饱和？其次是安全下限如何守住？是否需引入规则兜底？最后是如何实现“超级对齐”（Super Alignment），确保AI行为完全符合人类的安全意图？这些问题构成了未来技术探索的核心挑战。

下一代技术方向

2025年，小鹏的核心目标是实现广州Robotaxi的规模化运营。在此基础上，技术探索将聚焦于更极致的多模态融合、生成器与判别器的自我博弈机制，以及探索“自我进化”式AI系统。这些方向旨在进一步提升模型的泛化能力和自主决策水平。

行业格局判断

刘先明坚信，中国自动驾驶技术在全球范围内处于领先地位。他预计，2025年底至2026年初，各大厂商将推出下一代架构，形成明显的代际差异。其护城河来源，正是主机厂独有的数据闭环能力，这是第三方难以复制的。

原话摘录：“我觉得现在整个的 AI 的竞争在车企还是挺严重的，挺白热化的。嗯嗯，它是下一阶段的重要赛点。”

七、总结：一场关于“简化”与“涌现”的技术革命

刘先明的上任，标志着小鹏从“造车”向“构建物理AI系统”的战略跃迁。其核心逻辑可概括为：

“当你拥有足够大的数据与算力时，最有效的路径不是添加更多复杂模块，而是不断拆掉冗余，回归最原始的感知-决策-执行循环。”

这一思想贯穿于其职业生涯始终：从Facebook的“数据驱动”理念，到Cruise的“持续学习机器”构想，再到小鹏的“去语言化”实践，每一次技术跃迁都是对“复杂即正确”惯性的反叛。最终，这场变革的本质并非单纯的技术迭代，而是一场关于组织韧性、领导勇气与系统思维的全面考验。正如其所言：“简单的就是美的”，而真正的美，往往诞生于对复杂性的勇敢剥离之中。

原文转录

加载中...