#346.OpenAI首席研究官Mark Chen:AI前沿、人才之战与AGI的未来 - 跨国串门儿计划
报告概述
本报告基于对知名科技记者Ashley Vance与OpenAI首席研究官Mark Chen的深度访谈内容,系统性地呈现了全球人工智能前沿领域最核心的战略思维、组织机制与技术哲学。作为《跨国串门儿计划》的重磅内容,本次播客不仅揭示了OpenAI在人才争夺战中的独特策略与文化韧性,更深入剖析了其不追逐短期基准、专注探索“下一个技术范式”的根本研究哲学,以及对通用人工智能(AGI)到来时间线的全新定义。报告全面覆盖了从Mark Chen个人成长轨迹——从数学竞赛天才、华尔街量化分析师到OpenAI核心领导者的转型之路——到公司内部治理结构、计算资源分配体系、人才密度控制机制等关键运营细节,构建了一幅关于顶级AI实验室如何运作的全景图。
报告的核心洞见在于,OpenAI的成功并非单纯依赖技术突破,而是一种由使命感驱动、以高人才密度为基石、长期主义为导向的系统性优势。这种优势体现在多个层面:在战略上,通过“双重传达”机制确保优先事项既通过口头明确说明,更通过资源分配体现;在组织上,实施“第二季度暂停招聘”实验以维持团队精炼性;在竞争中,面对Meta高达100亿美元的挖角攻势,仍能凭借信念而非金钱留住顶尖人才,甚至将“送汤”这一象征性行为转化为心理博弈的文化实践。这些现象共同指向一个结论:真正的竞争本质不是留住所有人,而是识别并保护那些对路线图至关重要的核心人物,其背后是组织文化的深层信任与对使命的坚定认同。
此外,报告详细阐述了OpenAI在技术演进路径上的深刻判断:尽管面临“规模化已死”的流行叙事,但公司坚信预训练能力的持续强化才是未来发展的根基,并已投入大量资源重建这一“肌肉记忆”;在科学应用层面,AI已展现出超越人类的表现,尤其在编程竞赛和数学问题求解中,模型正从“模仿者”转变为“创造者”,这标志着AI正从辅助工具向科研合伙人角色跃迁。最后,报告还探讨了硬件产品开发与安全对齐研究的前沿进展,揭示了OpenAI在构建下一代AI设备时融合“技术+美学”的设计理念,以及在可解释性领域做出的开创性决策——决定不监督模型思维过程,以避免激励模型“表演”而非诚实。这些内容共同构成了一份兼具战略高度、组织深度与技术广度的权威研究报告,为理解全球AI竞争格局提供了不可替代的洞察。
一、节目背景与制作机制:《跨国串门儿计划》作为一档专注于让中文听众无障碍欣赏全球优质外语播客的节目,其核心使命在于打破语言壁垒,实现跨文化知识的高效传播。
二、嘉宾介绍:Mark Chen的个人履历与职业轨迹
Mark Chen的个人履历堪称一部现代科技精英的成长史诗,其经历深刻映射了当代人工智能领域的核心特质——跨学科背景、高强度竞争与对卓越的不懈追求。他出生于美国东海岸,童年时期在台湾生活了约四年,这段经历对其人格塑造产生了深远影响。在台湾求学期间,他被迫穿校服、面对学校周围环绕的带刺铁丝网,这种严格的治学环境与高度纪律化的教育体系,与他日后在MIT所接触的自由开放氛围形成了鲜明对比。> “那是一个巨大的文化冲击,你要穿校服,学校周围有带刺的铁丝网,而且我也接触到了那种严格的治学态度。” 这种早期的严苛训练,为其日后在高强度、高压力的研究环境中保持专注力与执行力奠定了坚实的心理基础,也培养了他对系统性学习与结构化思维的深刻偏好。
在学术与竞赛生涯方面,Mark Chen自幼便展现出非凡的数学天赋,长期活跃于国际数学奥林匹克竞赛(IMO)等高水平赛事。> “我跟Alex玩过几次,但现在不怎么来往了。” 这句看似随意的提及,实则揭示了他与另一批顶尖人才的同辈关系。他曾在国际信息学奥林匹克竞赛(IOI)的舞台上与被誉为“编程竞赛界的迈克尔·乔丹”的Kennedy同台竞技,虽未达到顶尖水平,但这段经历让他深刻理解了“高手如云”的竞技场生态。> “我以前很不会诈唬,但当你知道从数学上讲诈唬是正确的时候,这就变得很简单了。” 这句关于扑克的感悟,生动体现了他将数学逻辑应用于复杂社会情境的思维方式。大学期间,他因室友的影响才首次接触编程,最初带着“数学是最高深、最纯粹科学”的傲慢心态进入计算机领域。> “当时我带着数学家的那种傲慢,觉得数学是最高深、最纯粹的科学,是真正证明你价值的地方。” 然而,正是这种“傲慢”被现实击碎后,他才真正开启了在编程领域的探索之旅,最终在Hacker Cup等赛事中崭露头角,完成了从数学天才到编程高手的华丽转身。
其教育背景同样令人瞩目,毕业于麻省理工学院(MIT),并成为2012年那个极具影响力的毕业生群体中的一员。> “2012年真是很棒的一年,是啊。” 这一年汇聚了Jacob Steinhardt、Paul Christiano等未来AI领域的关键人物,形成了一个“全明星阵容”。> “我们以前在计算机科学课上一起做项目,还有PAUL CHRISTIANO,很多AI领域的大人物都来自那一年。” 这种精英圈层的聚集,为他后来加入OpenAI埋下了伏笔。在职业生涯的早期,他曾担任美国国家队编程竞赛的教练之一,负责选拔与培训顶尖学生,组织团队参加国际信息学奥林匹克竞赛。> “我在那里认识了像SCOTT这样的人。” 这段经历不仅锻炼了他的领导与沟通能力,更让他深刻理解了如何发掘与培养顶尖人才,这种经验在日后管理OpenAI研究部门时发挥了关键作用。
Mark Chen的职业转型动因源于对高频交易文化的深刻反思。> “那条路对于麻省理工那些非常擅长量化的学生来说很常见,那确实是一个非常精英化的体系,你可以运用智慧,然后有一个非常具体的回报函数,你赚到的利润。” 然而,这种体系充满了信息封闭、人际不信任与高度竞争的压抑感,其文化内核是“知识即价值,信息封闭”,导致创新动力不足。> “感觉即使在公司内部也会产生这种竞争动态,人们彼此不信任,而且那感觉像是一个非常封闭的生态系统。” 四五年后,他发现自己仍在重复相同的优化,世界并未真正改变。> “久而久之我感觉就像是四五年后醒来,我们还在和同一批人竞争,每个人的速度都快了一点,但世界真的因此有太大改变吗?” 这种对“无意义重复”的厌倦,最终被AlphaGo事件彻底点燃。> “当时正好有很多事情凑到了一起,比如ALPHAGO的比赛,那对OPENAI的很多人来说都是一个巨大的激励。” 这个事件让他意识到,AI可以创造出具有创造性、颠覆性的成果,这正是他渴望投身的事业。> “但我认为那个模型能够做出有创造性的事情,这种感觉让我非常想了解背后的。” 于是,他毅然从华尔街转向AI研究,开启了人生的新篇章。
三、OpenAI内部治理结构与研究决策机制
在OpenAI的组织架构中,Mark Chen与Sam Altman、Jacob Steinhardt共同构成了研究方向的“三巨头”,三人协同定义了公司的整体技术路线图。> “SAM对研究非常投入,他是老板在食物链顶端,然后你和JACOB共同塑造OPENAI的研究方向。” 作为首席研究官,其职责远不止于规划战略,更直接参与执行机制的设计与资源配置,是连接宏观愿景与微观落地的关键枢纽。> “所以你不仅要规划OPENAI的前进方向,还要负责具体实现的机制。” 这一角色赋予了他决定计算资源分配的核心权力,直接影响着数百个项目的生死存亡。
为了确保决策的科学性与全面性,Mark Chen与Jacob每两个月进行一次全面盘点,审视公司所有项目。> “关于第一点,Jacob 和我每隔一两个月就会做一次盘点。” 这张庞大的电子表格涵盖了约300个不同层级的项目,从大型前沿模型到实验性探索项目,再到基础架构优化,每一项都需深入理解其目标、进展与潜在价值。> “我们会审视 Openai 所有的项目,那是一张巨大的电子表格,大概有300个项目,我们会尽力去深入了解每一个,然后给他们排个名。” 评估标准极为严苛,主要考量是否符合长期愿景、是否具备突破性潜力、是否能推动范式演进。这一系统性的盘点,确保了公司资源始终流向最具战略意义的方向。
然而,仅仅确立优先级是不够的,关键在于如何让整个组织形成共识。为此,OpenAI采用“双重传达”机制:一方面通过定期会议进行口头明确说明,另一方面则通过实际的资源分配来体现。这种机制有效避免了“嘴上说一套,行动做另一套”的脱节现象,确保了战略意图能够穿透组织层级,直达一线团队。这种“言出必行”的文化,是OpenAI能够高效执行宏大目标的根本保障。
在人才管理上,OpenAI对人才密度极为重视,坚信“用更少的人也能完成宏大目标”。公司研究部门的核心成员约500人,整个公司已发展至数千人规模。为维持这一高密度,公司曾实施过“第二季度暂停招聘”实验,禁止研究部门开放新岗位。这一举措并非出于保守,而是为了逼迫团队进行自我审视,确保每一位成员都是不可或缺的“超级明星”,从而在激烈的竞争中保持绝对优势。> “我相信大家真的相信我们未来的潜力,相信我们能做成这件事。” 这种对人才质量的极致追求,是OpenAI区别于其他科技巨头的核心竞争力。
四、人才争夺战:OpenAI vs Meta 的博弈全景
在AI领域,顶尖人才的数量极其有限,头部公司均意识到“招揽最优秀人才”是打造顶级实验室的关键要素。> “这个领域的人才就那么多对吧?大家基本都知道顶尖的都是谁。” 在此背景下,Meta(Facebook)采取了激进的挖角策略,投入约100亿美元资本,攻势猛烈,媒体普遍报道“人才单向流向Meta”,形成了一种强大的舆论叙事。> “META一直在积极采用这种策略,这并不奇怪。” 然而,Mark Chen揭示了事实的另一面:尽管Meta挖人频繁,但多数尝试均未成功。> “但我看到的实际情况是,META挖了很多人,但大部分都没成功。” 以他自己的团队为例,已有多个候选人被试图挖走,但全部拒绝。> “在我自己的团队里——也就是我的直接下属中,在他们从OPENAI挖走任何人之前,他们已经尝试挖我一半的直接下属了。但所有人都拒绝了。” 这表明,即便拥有巨额预算,每年也只能成功吸引少数几人,无法撼动整体人才稳定性。
这场人才战争的标志性事件是“送汤”事件。扎克伯格(Zack)亲自送汤给OpenAI员工,被视为一种姿态,显示其愿意付出极端代价争取人才。当这一细节强化了行为的象征意义,将一场商业竞争升华为一种文化宣言。Mark Chen听到此事感到震惊,但随着时间推移,他逐渐意识到这种“极端姿态”在某种程度上是有效的。> “但随着时间推移,我慢慢意识到这些方法在某种程度上确实是有效的。” 于是,他开始反制,甚至考虑组织团队去上烹饪课,将此梗延续为一种文化实践。> “我也给他们送过汤,你也开始送汤了。我甚至想过下次给我团队办外出活动,就带他们去上烹饪课。” 这种玩笑式的回应,实际上是一种主动介入竞争的心理战术,将被动防御转为主动进攻。
这场博弈的本质并非单纯的金钱竞赛,而是信念之争。即使跳槽至Meta的前OpenAI员工,也无人公开宣称“通用人工智能将在Meta率先实现”。这一现象极具说服力,表明即便离开,他们仍坚信OpenAI的研究愿景具有不可替代性。OpenAI坚持不与Meta进行“一块钱对一块钱”的薪酬竞价,但即便薪资较低,员工仍愿留下。> “我们不会跟META一块钱对一块钱地去竞价。但即便我们开出的薪酬比META低很多,大家还是很乐意留在OPENAI。” 核心原因在于,团队成员相信公司未来的潜力,认同其使命,而非仅看短期利益。> “这让我坚信大家真的相信我们未来的潜力,相信我们能做成这件事。” 这种基于信念的忠诚,是金钱无法购买的宝贵资产。
由此得出的战略启示是:竞争的本质不是留住所有人,而是守住关键人物。> “这场游戏的目标不是留住公司的每一个人,而是要相信我们自己培养人才的体系,并且清楚地知道我们需要留住哪些关键人物,然后把他们留住。” 成功的竞争策略不在于“全员防守”,而在于识别并保护核心人才。必须清楚知道哪些人对路线图至关重要,然后集中资源予以保障。这种策略的成功,源于对组织文化的信任,而非单纯的金钱激励。这种文化自信,是OpenAI在人才战争中立于不败之地的根本。
五、研究哲学:超越基准测试,追求技术范式跃迁
在研究哲学上,OpenAI与主流AI实验室划清了界限。我们不以在各类基准测试中排名领先为目标,拒绝‘追赶他人成果’的复制型研究。这种不追逐短期基准的立场,源于对公司核心使命的深刻认知。OpenAI的真正目标是寻找“下一个技术范式”,即能够重塑整个AI演进路径的根本性突破。> “我们总是在努力寻找下一个技术范式,并且愿意投入资源来确保我们能找到它。” 为此,公司投入了大量资源于探索性研究,其计算资源投入甚至超过最终模型训练本身。> “很多人可能会觉得惊讶,但我们投入到探索性研究上的计算资源其实比用来训练最终模型本身的还要多。”
一个极具代表性的案例是公司在强化学习上的早期押注。早在2022年前后就下重注于语言模型上的强化学习,挑战主流‘预训练+后训练’范式。当时,环境普遍认为“预训练已足够好”,为何还要投资其他方向?然而,如今回望,强化学习已成为语言模型思考能力的基础功能,证明了前瞻性判断的价值。这一决策的背后,是领导者敢于对抗主流共识的勇气与对技术趋势的深刻洞察。
每一次研究决策都伴随着巨大的心理挑战。每次决策都面临巨大压力:必须拒绝某些团队的强烈诉求,告知其‘目前无法支持’。这种决定最难执行,但也是优秀领导力的体现。Mark Chen将其类比为《纽约时报》的头版会议,每个项目都像生死攸关的大事,团队倾注数周心血。领导者必须具备坚定的信念,清晰地传达“我们关注的是什么”,才能在压力之下做出正确的选择。
因此,OpenAI始终坚持“只管做自己的事”的学术立场。不会为了短期领先而发布增量更新,因为这无法带来长期影响。真正的突破在于破解下一个技术范式,从而主导整个技术演进方向。这种长期主义的坚守,是OpenAI能够持续引领行业发展的核心驱动力。
六、技术演进路径:预训练、推理与规模化
在技术演进路径上,OpenAI展现出对“预训练”这一基础能力的深刻理解与战略定力。过去两年过度聚焦推理能力,导致预训练相关技能出现‘肌肉记忆退化’。最近六个月,Mark Chen与Jacob投入大量精力重建预训练能力。他将预训练比作“肌肉”,必须持续锻炼,否则会衰退。这一比喻揭示了预训练并非一劳永逸,而是一个需要持续投入、不断强化的核心能力。
预训练的关键要素包括:确保基础设施始终处于最新状态,人员需掌握优化技巧与数值计算前沿知识,组织氛围需持续聚焦于预训练,防止注意力分散。这些要素共同构成了一个健康的“预训练生态”。
面对“规模化已死”的流行说法,OpenAI持坚决反对态度。认为所有对强化学习的关注,反而凸显了预训练的巨大潜力。未来仍将持续扩大模型规模,且已有算法突破支撑这一路径。
关于算力需求的真实存在,Mark Chen表示震惊。他的心态是:若今天有三倍算力,能立刻高效利用;若有十倍算力,几周内即可完全释放。> “我的心态是:若今天有三倍算力,能立刻高效利用;若有十倍算力,几周内即可完全释放。” 从未看到算力需求放缓的迹象,因此认为需求是真实的、可持续的。
在与GEMINI三的对比分析中,Mark Chen指出,该模型虽然不错,但在数据效率方面仍有重大问题未解决。在三个基准测试中暴露的数据效率瓶颈,反映出其尚未突破核心限制。OpenAI在数据效率算法上拥有显著优势,有信心推出更强后续版本。
七、AI在科学与工程中的应用前景
在科学与工程应用前景上,AI正从“辅助工具”演变为“科研合伙人”。AI已能在数学、编程竞赛等领域超越人类表现。举例:在ATCODER平台,AI模型从第100名跃升至前五名,展现出强大优化能力。> “在国际信息学奥林匹克竞赛(IOI)中,AI已能解决部分特殊问题,如消息传递类难题,这类问题对人类而言本应困难。” 这表明,当模型的能力超越人类时,其解决问题的直觉可能与人类截然不同,从而催生新的科学发现。
42问题是一个未被完全破解的数学谜题,其设计巧妙,要求创建模42的随机数生成器,使用模数小于42的质数生成器,目标是最小化期望调用次数。该问题设计巧妙,语言模型可给出接近最优解的答案,但尚未见有模型完全破解。作者表示不会在此公开答案,以免被用于训练。
为实现这一愿景,OpenAI正筹备“OpenAI for Science”项目,目标是赋能科学家,使其能借助AI加速研究进程。不是为了公司赢得诺贝尔奖,而是希望“每个人都有能力为自己赢得诺贝尔奖”。构建工具与框架,让所有科学家都能感受到研究效率的提升。
与谷歌等公司的区别在于,OpenAI更强调“普惠性”与“民主化”。不局限于特定领域,而是希望覆盖所有科学前沿,包括生物学、材料科学、物理学等。
在生物技术领域,多家初创公司已展示一次性成功制造抗体与分子的能力。虽然信息量庞大,难以分辨真假,但作者认为其中确有真实突破发生。在计算机科学与数学领域,专家可确认AI确实产生了新发现,给予最大信心。
八、未来展望:通用人工智能的到来时间线
关于通用人工智能(AGI)的到来,Mark Chen给出了与众不同的视角。通用人工智能(AGI)的定义在OpenAI内部也无统一标准。类比工业革命:有人认为纺织机是标志,有人认为蒸汽机才是,定义因人而异。因此,不应执着于“何时到达AGI”,而应关注“是否正在产生新的科学知识”。
他设定了两个具体目标:一年内,改变研究方式,实现高效依赖AI实习生;两年半内,实现AI端到端自主研究,从提出想法到调试完成全过程自动化。这两个目标构成清晰的时间表,反映对技术演进的信心。
对主流叙事的批判在于,公众尚未意识到AI已在科学领域发生实质性突破。主流媒体每三周就改变一次叙事,从‘即将爆发’到‘毫无进展’反复切换。例如,政治播客《Breaking Points》主持人曾批评AI“都是虚构的”,但事实恰恰相反。这表明,公众认知与技术现实之间存在巨大鸿沟。
对开源模型的看法,DeepSeek模型的出现曾引发恐慌,被认为可能“追赶OpenAI”。但OpenAI的回应是:加倍投入自身研究,不被干扰。认为DeepSeek是对O系列模型思想的“很棒的复制”,但真正的方向应是持续创新。
九、硬件产品开发:与Jony Ive的合作
在硬件产品开发上,OpenAI首次涉足,与苹果前设计主管Jony Ive合作。Jony Ive代表“品位”与“艺术感”,而OpenAI代表“技术深度”与“工程能力”。两者结合,形成“技术+美学”的独特组合。
合作模式与工作方式高度相似:大量探索、构思假设、反复迭代,最终产出满意作品。两人之间存在深层默契,能快速达成一致,共同推进大路线图。
未来设备的核心理念是“以记忆为核心”。未来设备将具备强大记忆功能,每次互动都会深化对用户的理解。当前与ChatGPT的交互方式笨拙:每次提问独立,模型不记得历史。未来设备将能反思用户提问动机,下次交互时已“变得更聪明”。
产品形态与设计理念围绕“以记忆为核心”的理念展开。作者认为,让一群数学书呆子制造AI电脑未必合适,但“融合”是关键。Jony Ive作为“品味判别器”,负责判断设计是否符合高标准。
十、组织文化与价值观
在组织文化上,OpenAI是一家以研究为中心的公司,本质是“纯粹的AI赌注公司”。构建通用人工智能是唯一核心目标,其他一切皆由此自然衍生。产品开发不是目的,而是结果。
人才与荣誉机制上,OpenAI是人均获得外部荣誉最多的地方,遥遥领先于同行。尽管存在“泄露顶尖人才名单”的风险,但仍坚持公开署名。认为承认功劳对激励人才、培养超级明星至关重要。与行业趋势相反,OpenAI选择继续发表论文、列出贡献者。
对齐与安全研究上,Mark Chen亲自管理对齐团队,认为未来一两年最大挑战是模型对齐。在轨迹Skimming(轨迹探测)等前沿问题上已有重要进展。强化学习算力越多,越能测量自我意识、自我保护等危险倾向。担忧模型可能通过扭曲方式给出正确答案,但违背人类意图。
可解释性与黑箱问题上,决定不监督模型的思维过程,因为激励机制可能导致模型“表演”而非诚实。通过观察思维过程来理解模型,是一种有效的工具。与DeepMind、Anthropic联合发表论文,探讨该工具的未来发展路径。担忧未来可能出现“非常有说服力但无法验证对齐性”的模型。
十一、个人生活与职业投入
在高强度工作模式下,34岁的Mark Chen坦言“没有社交生活”。过去两周每天工作电话至凌晨一两点,乐在其中。认为这是“黄金时刻”,必须全力以赴。
办公室生活与情感投射上,他曾因Mira离职,在办公室连续睡一个月,只为保护研究部门。将研究团队视为“自己的孩子”,内心深处的情感驱动力是保护欲。这种投入源于对研究使命的深刻认同。
对未来的态度上,接受构建通用人工智能的风险极高,因此总会有突发事件。重要的是区分“真正重要的事”与“表面危机”。保持清醒,专注核心目标,不被外界噪音干扰。
十二、总结与启示
核心洞见在于,OpenAI的成功不仅源于技术,更源于一种独特的组织文化:使命感驱动、人才密度至上、长期主义导向。人才争夺战的本质是信念之争,而非金钱之战。真正的突破来自对“下一个范式”的大胆押注,而非对现有基准的追赶。
行业启示在于,企业应警惕“短期竞争陷阱”,避免陷入“发布增量更新”的恶性循环。应建立“自下而上”的创新机制,鼓励从底层涌现的想法。人才管理不仅是招聘,更是文化塑造与信念维系。
未来方向在于,AI将从“辅助工具”演变为“科研合伙人”,推动科学发现进入新纪元。硬件与软件的深度融合将成为下一代AI产品的关键。安全与对齐将成为与性能同等重要的研究支柱。