Michael Nielsen – Why aliens will have a different tech stack than us

节目

Dwarkesh Patel

嘉宾

Michael Nielsen

日期

2026-04

时长

123 min

查看原始内容 →

概要

科学史上最著名的"证伪"案例远比教科书叙事复杂。 Michelson-Morley 实验（1887年）并未"推翻以太理论"——Michelson 本人直到1929年去世仍相信以太存在。Einstein 后来表示自己当时甚至不确定是否读过那篇论文。Lorentz 的数学框架与狭义相对论在实验上不可区分，直到1940年μ子衰变实验才提供了真正的区分性证据。这些案例表明，科学进步发生的速度远快于严格的验证循环所能解释的。

AI"闭合科学验证循环"的叙事忽略了一个根本事实：任何实验都兼容无穷多理论。 AlphaFold 的成功主要归功于 Protein Data Bank 数十亿美元的实验投入和18万蛋白质结构数据，AI 部分只是总投入的一小部分。科学中真正的瓶颈不在于拟合数据，而在于产生正确的理论直觉——从 Ptolemy 的本轮到 Copernicus 的日心说的跳跃，不是梯度下降能完成的。

科技树远比人类已探索的部分庞大得多，外星文明很可能有完全不同的技术栈。 计算机科学的"万物理论"早在1930年代就由 Turing 和 Church 建立，但公钥密码学、加密货币等深层思想在其中隐藏了数十年才被发现。物质相态不断被发现新类型（超导体、BEC、分数量子霍尔系统），这暗示我们仍处于科技树的底部。不同文明的感知偏差和路径依赖会导致截然不同的探索方向，从而产生巨大的贸易收益。

"递减回报"论断忽视了新领域的爆发。 如同甜品自助餐不断被补充新品，计算机科学从数学基础问题的"副产品"中诞生，深度学习从看似边缘的神经网络研究中爆发——每次新领域出现，21岁的年轻人就能做出重大突破，递减回报的论证就失效了。

贯穿全场的核心线索是"科学进步不可被还原为方法"——从 Michelson 的以太执念到 Poincaré 的"差一步"，从 Prout 假说85年的"敌意验证循环"到 AlphaFold 的三种解读，Nielsen 反复从不同角度论证同一个命题：科学需要多元研究纲领长期并存，需要品味和直觉，而这些恰恰是最难自动化的。

Michelson-Morley 的真实历史：证伪论的幻觉

核心要点：教科书版"实验推翻旧理论→危机→新理论诞生"的叙事是严重简化，真实历史中理论更替极其混乱缓慢。

Michelson-Morley 实验（1887年）并非要证明以太不存在，而是在多种以太理论之间做区分——具体来说是检验"以太风"是否存在。实验否定了以太风假说，但这只排除了部分以太理论，远非全部。

Michelson 从1881年开始做实验，一直持续到1920年代，至1929年去世仍公开表示相信以太。另一位物理学家 Miller 在1920年代跑到 Mount Wilson 高海拔处做实验，认为自己测到了以太效应。Einstein 听闻后说出了名言"Subtle is the Lord, but malicious He is not."

Lorentz 在19世纪末独立推导出了 Lorentz 变换——狭义相对论的数学基础——但将其解释为以太中运动的效应。他引入了"local time"概念，但并未赋予其物理意义；Einstein 后来认识到这就是另一个惯性参考系中的真实时间。

直到1940年左右，μ子衰变实验（宇宙射线击中大气层顶部产生的μ子衰变速率异常缓慢）才提供了区分 Lorentz 解释和狭义相对论的实验证据——此时 Lorentz 已去世十余年。

Nielsen 引用了 Abraham Pais 的 Einstein 传记《Subtle is the Lord》和 Imre Lakatos 的《科学研究纲领方法论》来支撑这些论点。

"It's not clear what is being falsified. Is it just another version of the theory of the ether that's being falsified?" —— Michael Nielsen

Poincaré 的"差一步"：专业知识成为认知牢笼

核心要点：Poincaré 理解了狭义相对论的两个核心前提（相对性原理和光速不变），却因为"懂得太多"而无法完成最后的认知跳跃。

Poincaré 理解了相对性原理（物理定律在所有惯性参考系中相同）和光速在所有参考系中恒定——这基本上就是 Einstein 推导出狭义相对论所用的全部前提。

但 Poincaré 还额外持有一个错误信念：他认为尺缩（length contraction）是一种动力学效应——某种外力在挤压粒子。他没有理解这是纯粹的运动学现象，是时空本身的性质与我们原先的认知不同。

1909年，Poincaré 仍在发表论文维护这种动力学解释。Nielsen 推测这是因为"他知道得太多"——巨大的专业知识反而阻止了他放弃旧框架。

相比之下，1890年代的少年 Einstein 也相信以太，但他对旧理论的依附远不如这些前辈深。

"His expertise seems to be getting in the way. He knows so much, he understands so much, and then he's not able to let go of these things." —— Michael Nielsen

类似模式反复出现：Einstein 本人后来也未能接受量子力学的正统解释，成了被自己专业知识束缚的一方。

日心说与 Darwin：没有验证循环的科学进步

核心要点：科学共同体在验证循环闭合之前就已做出正确判断——Aristarchus 公元前2世纪提出日心说，但直到1838年才测到恒星视差；自然选择看似"简单"却需要深度时间作为前置条件。

Aristarchus 在公元前2世纪提出日心说，古代雅典人以"看不到恒星视差"为由否定——除非恒星极其遥远。直到1838年恒星视差才被实测，但人类并不需要等到那时才接受日心说。

一个反直觉的事实：Copernicus 的模型实际上比 Ptolemy 有更多本轮（epicycles），因为 Copernicus 坚持认为地球应做匀速圆周运动。所以日心说既不更精确，也不更简洁——那么当时凭什么判断它更正确？

Nielsen 承认不完全知道答案，但给出了部分解释：Newton 后来用同一套引力理论统一解释了行星运动、地球上的抛物线运动和潮汐——三个看似毫不相关的现象由同一组思想解释，这种统一性极具说服力。

Darwin 的情况不同。自然选择的核心概念对动物育种者来说并不新鲜。Darwin 的真正贡献不是提出概念，而是证明它可以解释生物圈中几乎所有多样性——写出《物种起源》中海量的证据和案例。

Dwarkesh 提出 Lucretius（公元前1世纪罗马诗人）似乎也有类似自然选择的想法。但 Nielsen 指出 Lucretius 的想法与真正的自然选择根本不同——他认为存在一个远古"生成期"产生所有物种，然后一次性淘汰，而非持续渐进的演化过程。

1830年代 Charles Lyell 发现"深度时间"（地球有数亿年历史）是 Darwin 的关键前置条件——如果宇宙只有6000年历史（Bishop Ussher 的计算），自然选择就不可行。Darwin 与 Wallace 几乎同时独立发现自然选择，进一步证明"前置条件"成熟的重要性。

"The idea must have been known to animal breeders for a long time at some level... Darwin's genius wasn't in having that idea, it was understanding just how central it was to biology." —— Michael Nielsen

AlphaFold：神经网络是科学解释吗？三种可能

核心要点：AlphaFold 的成功主要是数据采集的故事，AI只占总投入的一小部分。但对于"神经网络是否算科学解释"存在三种有趣的解读。

AlphaFold 的核心其实是 Protein Data Bank——数十年、数十亿美元的 X-ray diffraction、NMR、cryo-EM 实验获得的约18万蛋白质结构。AI 模型是在这个巨大数据集基础上做的拟合，是总投资的一小部分。

解读一（保守）：AlphaFold 不是科学解释——它只是个有用的模型，参数太多、不够简洁、没有深层解释力。

解读二（中间）：AlphaFold 本身不是解释，但可以从中提取解释。AlphaZero 就是先例——Magnus Carlsen 在 AlphaZero 策略公开后明显改变了棋风，虽然没有公开确认，但专家们注意到了。可解释性工作可以从模型中"考古"出有意义的原理。

解读三（最激进）：神经网络是一种全新类型的认识论对象。过去一个100页方程式（在1920年代就意味着放弃），今天用 Mathematica 可以继续处理。类似地，也许我们可以对神经网络进行合并、蒸馏、压缩等操作——这不是传统意义上的解释，但可能是某种新的认知工具。

Dwarkesh 提出了有力的反例：假设在1500年训练一个模型学习天体运动数据，做可解释性分析只会不断发现新的本轮——参数 X 到 Y 编码了这个本轮，参数 Z 编码了那个——你永远不会从中跳到"换一下太阳和地球的位置"。从 Ptolemy 到 Copernicus 的跳跃不是局部优化能完成的。

"We don't have the verbs yet." —— Michael Nielsen（论我们还不知道如何操作这些模型对象）

AI 无法简单闭合科学验证循环：多元研究纲领必须共存

核心要点：同一类推理方法在一个案例中大获成功、在另一个案例中完全失败——你无法事先区分，因此需要同时维护多个研究纲领。

经典对比案例：天王星轨道异常 → Le Verrier 1846年预测海王星的存在 → 把望远镜指向正确方向，果然发现了 → Newton 引力的巨大成功。水星轨道异常 → 预测内侧有一颗行星 Vulcan → 把望远镜指过去，什么也没有 → 实际原因是需要广义相对论。完全相同的推理方法，一次成功一次失败，事先无法区分。

1990年代的 Pioneer 航天器位置异常提供了现代版案例：有人兴奋地以为广义相对论要被推翻了，结果最终解释是航天器热辐射的微小不对称造成了朝太阳方向的微弱加速。99.9%的"反常"都是这类平淡解释，但偶尔一次不是——这正是科学史引人入胜的地方。

Lakatos 书中讲述的 Prout 假说案例更极端：1815年 Prout 假说所有原子核重量为整数（本质上都由氢构成），但氯的实测重量是35.5。Prout 学派不断提出修正（化学杂质、分数整数……），但氯的精确测量是35.46，越来越偏离。85年后同位素概念才被发现——氯的"35.46"实际上是不同同位素的加权平均，而同位素无法通过化学方法区分，只能通过物理方法。在这85年中，验证循环对正确理论是主动敌意的。

Nielsen 的核心论点：科学需要维护多个竞争性研究纲领同时存活，即使某些在当下看起来"已被证伪"。这种多样性是人类科学的核心优势，也恰恰是最难用 AI 自动化的能力。

"The thing is there's no ex ante heuristic which tells you which case you're in." —— Michael Nielsen

科技树远比想象的庞大：外星文明会有不同的技术栈

核心要点：我们仍处于科技树的底部。公钥密码学早在1930年代的计算理论中就隐含存在，但人类花了数十年才发现它——类似的深层思想还有无数个等待被发掘。

Nielsen 的核心直觉：科技树可能大到任何文明都永远无法探索完，探索路径的选择真正重要——这与技术决定论（所有文明最终殛合到同一技术）相对。

具体论证：Church 和 Turing 在1930年代就建立了计算理论的"万物理论"（what computation is），但公钥密码学直到1970年代才被发现，加密货币/分布式账本更晚——这些深层思想在1930年代就已经"存在"于理论中，只是隐藏着。Knuth 提到一位数学家曾不屑地说"等计算机科学有1000个深定理再来找我"——Knuth 数十年后感叹"显然现在已经有了"。

物质相态不断被发现新类型：学校教三种（固液气），成年后发现还有超导体、超流体、Bose-Einstein 凝聚态、量子霍尔系统、分数量子霍尔系统等。未来我们甚至可以设计新的物质相态。

不同文明的生物偏差（人类偏视觉，某些动物偏听觉）会影响思维方式和探索方向。更"外星"的感知方式可能导致完全不同的科技路径。

蛋白质作为"外星 GitHub"的类比：自然进化40亿年产生的数以亿计的蛋白质就像一个外星文明赠送的代码库——我们对其中已知的蛋白质（如血红蛋白、胰岛素、核糖体、kinesin）仍有大量不理解的地方，关于hemoglobin就有数万篇论文。Nielsen 最初就是从思考蛋白质中产生了"科技树远比想象的大"这个直觉。

"Most parts of the tech tree are never going to be explored. There are just too many interesting ways of combining things." —— Michael Nielsen

递减回报 vs 新领域爆发：甜品自助餐类比

核心要点：在静态快照中看到的递减回报，并不意味着内在的递减——每当新领域爆发，"甜品台"就被补充了全新的选择。

甜品自助餐类比：如果30种甜品摆出来，最好的当然先被拿走——这就是为什么你会看到递减回报。但如果有人不断在台子后面补充新甜品（而且新甜品可能比之前任何都好），递减回报的论证就崩塌了。

计算机科学从数理逻辑中"副产品"式诞生就是最好的例子——一群人在攻克抽象的数学基础问题，结果发现了一个全新的基础领域，突然间进步变得容易，年轻人涌入，不需要25年的积累就能做出重大突破。

Dwarkesh 引用 Nicholas Bloom 等人的研究：半导体行业维持 Moore's law（晶体管密度每年增长40%）需要科学家数量每年增长9%。Nielsen 回应这类分析过于狭窄——它们选择特定指标、特定行业，忽视了 GPU 并行计算这类全新能力的出现及其外溢效应。

Nielsen 承认即使考虑新领域爆发，仍存在某种递减回报现象。他猜测可能与个体认知能力没有显著提升有关——"也许那些也需要被改善"。

文明间的贸易收益：比较优势的局限

核心要点：如果不同文明有不同的技术栈，那么文明间的贸易收益将是巨大的——但比较优势理论有其边界条件。

Dwarkesh 指出：如果科技路径高度依赖偶然性，那么不同文明之间就存在巨大的贸易收益——"friendliness much more rewarding"。Nielsen 对这一推论感到兴奋，承认自己之前没想到过。

但 Nielsen 也提出了比较优势的局限：我们不和黑猩猩做贸易（尽管它们能做有趣的事），因为"一旦存在足够大的权力不对称，群体往往会转向支配模式"。

马匹类比（Dwarkesh 提出，对"AGI时代人类靠比较优势就业"论调的反驳）：数学上马和汽车有比较优势，但(1) 为马和汽车共存修路的交易成本太高；(2) 在旧金山养一匹马每年可能要10万美元，比较优势带来的收益低于这个生存成本。类比到 AGI 时代：以1000倍速度思考的 AI 之间直接传输 latent states，把人类加入供应链的交易成本远高于收益。

量子计算的起源：偶然性、Feynman 的 PC 和"follow-up 市场"

核心要点：量子计算之所以在1980年代而非1950年代诞生，是两个独立条件（个人电脑让计算变得显著、Paul trap 实现单量子态操控）恰好在同一时期成熟的历史偶然。

John von Neumann 在1950年代完全有能力发明量子计算——他同时是计算先驱和量子力学专家，写过重要的量子力学著作。但量子计算等到了 Feynman（1982年论文）和 David Deutsch（1985年论文）才被提出。

两个关键条件在1980年前后同时成熟：(1) 个人电脑（Apple II、Commodore 64）让"计算"成为更多人关注的显著话题；(2) Paul trap 技术首次实现了单离子的操控——此前人类从未有能力操纵单个量子态。

Feynman 的趣闻：他在1980-81年买了最早的 PC，兴奋到在搬运时绊倒严重受伤——一个深谙量子力学的天才同时对新计算设备无比兴奋，"历史偶然的巧合"。

Nielsen 自己的故事：1992年在 Gerard Milburn 的量子力学课后主动要论文读，Milburn 给了他一摞包括 Deutsch 和 Feynman 论文在内的量子计算基础文献——当时全世界几乎没人在做这个方向。Nielsen 受益于 Milburn 的"品味"（taste）。

Deutsch 论文中的核心命题：通用量子图灵机应该能高效模拟任何物理系统——这是一个关于宇宙本质的根本问题。

"I am in contact with something which is (A) deeply important, and (B) we as a civilization don't have this." —— Michael Nielsen（描述1992年初读量子计算论文的感受）

开放科学运动与知识的政治经济学

核心要点：开放科学的最大成功是让"公费资助的科学是否应该开放"成为一个活跃议题——但更深层的问题是知识的归属经济如何重构。

历史回溯：Galileo 和 Kepler 时代，科学家会把发现写成变位词（anagram）发表——如果别人后来做出同样发现，再解开变位词证明优先权。花了一个多世纪才建立起现代的论文发表+归属系统。

物理 vs 生物的预印本悖论：物理学家说"物理竞争太激烈，必须尽快上传预印本建立优先权"。生物学家说"生物竞争太激烈，必须靠期刊保护优先权，不能上传预印本"。两个群体用完全相反的逻辑为各自的做法辩护——这恰恰说明归属经济是社会建构的，而非某种必然。

现代的挑战：你可以分享代码、数据、半成品想法，但这些没有直接的学术信用关联。多少声誉应该与之挂钩？这完全是社会约定。让这些问题成为活跃讨论的议题，本身就是开放科学运动的重要成果。

多产 vs 深度：如何真正学习

核心要点：创造性工作中有两种截然不同的模式——例行工作（避免拖延、尽快完成）和高方差工作（需要愿意花大量时间、接受大部分不会有产出）——大多数人擅长其中一种而忽视另一种。

Dean Keith Simonton 的等概率法则（equal odds rule）：在一个人的职业生涯中，任何一个作品成为重要作品的概率大致相同——决定最高产出期的是发表量。Shakespeare 就是大量写。

Nielsen 的个人经验：写过几天完成的10000字文章，也写过花三到六个月的。"几天写完的那些，我没从中学到多少。而花了三个月的那些，15年后我还记得。"

"卡住"（being stuck）本身可能是学习过程中最重要的部分——痛苦的挣扎才能带来真正的内化。

Alan Kay 评 Linux 的名言："It doesn't have anything to do with computer science. It's just a great big ball of mud. There are a few interesting ideas in there which are worth understanding, but mostly all you're learning is stuff about Linux. You're not actually learning anything which is transferable." Nielsen 将此视为一种警示：有些学习活动表面上很充实（像 Rube Goldberg machine），但实际上你只是在学习那个系统本身，而非可迁移的深层原理。

Dwarkesh 的播客学习困境：如何让访谈产生复利

核心要点：Dwarkesh 坦言担心自己的访谈学习没有复利——每次都建立起浅层理解然后就折旧了。Nielsen 建议提高标准、选择有明确课程化路径的领域、引入"demanding taskmaster"。

Dwarkesh 的核心困境：AI 领域有明确的"练习题"（如实现 transformer），但历史、物理等领域没有——"我该不该做历史类节目？"

他的反思：如果在每次访谈后花时间写2000字总结、把学到的东西与已知知识连接起来，效果会好得多。他请了一位物理学家朋友为 Susskind 的狭义相对论课程设计练习题。

Nielsen 的建议核心："How do you make it a higher-growth context? How do you make it a more demanding context?" 如果一百万美元赌在上面，你会投入同样的努力吗？答案总是"不会"——我们以为自己尽力了，其实远远没有。

LLM 的陷阱：Nielsen 和 Dwarkesh 都注意到，与 chatbot 对话可以轻松绕过真正困难的思考——"It's somewhat valuable. That's part of the seductiveness... But it can substitute for actually doing the thing that maybe you should be doing." 它替代了中间的独立思考，因为你总是可以问下一个问题而不是自己去想。

"There's a certain kind of seductiveness to some things where it's sort of a Rube Goldberg machine. You can just learn about all the bits, and it feels entertaining. But if you step back and think about what you're actually doing here, it might not actually be meeting your objectives." —— Michael Nielsen

附录：关键人/机构/产品/数据

项目	详情
Michael Nielsen	Astera Institute 研究员，量子计算先驱，"Mike and Ike" 教科书合著者
Dwarkesh Patel	播客主持人，以高难度科学/技术访谈著称
Abraham Pais	Einstein 传记《Subtle is the Lord》作者
Imre Lakatos	《科学研究纲领方法论》作者，反证伪主义科学哲学家
Gerard Milburn	澳大利亚物理学家，Nielsen 的量子力学老师，量子计算实用方案的最早提出者之一
David Deutsch	1985年量子计算奠基论文作者
Protein Data Bank	~18万蛋白质结构，投入数十亿美元
Nicholas Bloom	论文研究者：半导体科学家增长9%/年 ↔ 晶体管密度增长40%/年
Dean Keith Simonton	等概率法则：任何作品成为重要作品的概率大致相同
Le Verrier	1846年预测海王星存在
Prout 假说	1815年假设原子量为整数，85年后被同位素概念解答
Pioneer 异常	1990s，航天器位置异常最终归因于热辐射不对称
Michelson-Morley	1887年实验否定以太风，但 Michelson 至1929年仍信以太
μ子衰变实验	~1940年，首次提供狭义相对论 vs Lorentz 解释的区分性证据