概要
- 当前 AI 已经"远不止火花",但能力极不均衡:它能说约 150 种语言、通用知识惊人(连 Legg 在新西兰长大的小镇都知道),却仍不擅长持续学习(像入职新工作那样长期学新技能)和视觉推理(如判断远近两车谁更大、数图上某节点的边数)。Legg 认为这些都没有根本性障碍,几年内会逐一解决。
- AGI 不是一条非黑即白的门槛,而是分级谱系:minimal AGI(能做人类通常能做的各类认知任务,他猜约 2 年到)→ full AGI(覆盖人类认知全谱,含爱因斯坦/莫扎特级别的非凡成就)→ ASI 人工超级智能。他坚持 AGI 的核心是"通用性"(the G),而非任务清单或"从 10 万赚到 100 万"这类狭窄经济指标。
- 他认为超级智能几乎必然到来,论据是大脑物理学:人脑约 2 磅、20 瓦、皮层信号约 100 赫兹、电化学波约 30 米/秒;数据中心可达数百万磅、200 兆瓦、100 亿赫兹、光速传播——能耗/空间/带宽/信号速度四个维度同时差 6–8 个数量级。"人类智能会是可能性的上限吗?我认为绝对不是。"
- 安全的关键是让 AI 把伦理当成推理问题:他提出"系统二安全"(即思维链监控,借卡尼曼系统一/系统二框架)——若能让 AI 像人面对道德困境时那样停下来推理,并以超人水平一致地应用伦理,AI 原则上可以比人更有道德。配套是危险能力测试(生物武器、黑客)、部署后监控、可解释性与回滚。
- 社会冲击被严重低估,且即将到来:他对英国 Russell Group 大学副校长们说 AGI 十年内会来;未来几年软件工程等领域,原本需要 100 名工程师的活也许只需 20 名。他认为公众反而比"觉得自己领域特殊"的专家更早看懂这件事。
- 主线:贯穿全场的是两条交织的线索——AGI 的本质是"通用性"且能力多维不均衡(所以必须看全貌、分维度理解),而它正以被低估的速度到来并将结构性重塑经济社会;安全(让超级智能"超级有道德")与财富分配,是把"黄金时代"潜力兑现的两道关。
当前 AI 已"远不止火花",但能力是一张参差不齐的地图
核心要点:Legg 说现在的 AI 已经不是"AGI 的火花"而是"远不止火花"——它在语言和知识上早已超人,却在持续学习和视觉推理上明显低于人类,呈现一张高度不均衡的能力地图。
- 五年前 Hannah Fry 上次访谈时,Legg 还在讲 AGI 的"愿景";这次她问现在的 AI 是否显出"一点点 AGI 的火花",Legg 直接回:"我觉得远不止火花。"
- 超人的一面:能说约 150 种语言("没人能做到");通用知识"惊人"——他随口问 AI 关于自己在新西兰长大的小镇,它居然知道相关的事。
- 落后的一面:持续学习——AI 不擅长在较长时间里学新技能,"就像你入职一份新工作,没人指望你一来就什么都会,但你得边干边学",AI 做不到这点。
- 视觉推理的具体短板:给 AI 看一红一蓝两辆车问哪辆更大,人懂得有透视、蓝车可能其实更大只是因为远而显小,AI 则不太行;给一张带节点和边的图(mathematician 会叫 graph),让它数某个节点伸出几条边(spokes),人会逐点注意再心算,AI 也不擅长。
- Legg 判断这些都"没有根本性障碍",DeepMind 有思路、相关指标在逐年改善,预计几年内补齐;但这是一条"很长的尾巴",在不少认知任务上 AI 仍低于人类。
"我的 AGI 定义,有时叫 minimal AGI,是:一个人工智能体,至少能做人类通常能做的各类认知任务。" —— Shane Legg
让 AI 更可靠,不只是"更大、更多数据",还要算法与架构的改变
核心要点:通往可靠性的路不是单一的"把模型做大或喂更多数据",而是针对具体短板的组合拳——某些靠特定类型数据,某些必须靠新算法和新架构。
- Hannah 追问:让模型更可靠,是不是就是做大、上规模、加数据?Legg 说"我们确实有清晰路径,但不是某一件事"。
- 视觉推理这类,往往是"特定类型的数据"问题——一旦收集到需要视觉推理的数据,模型就学会了。
- 持续学习则需要算法层面的新机制:比如把新信息存进某种检索系统、一种"情景记忆"(episodic memory),再让这些信息随时间被训练回底层模型——"这需要的不只是更多数据,而是算法和架构的改变"。
- 结论:答案是这些手段的组合,取决于具体卡在哪。
AGI 的分级:minimal AGI → full AGI → 超级智能 ASI
核心要点:Legg 主张 AGI 是一个连续的能力谱系而非单一阈值,并给出三级刻度——能做人类典型认知(minimal)、覆盖人类认知全谱(full)、超越人类认知(ASI)。
- minimal AGI:AI 不再以"换作人来做会让我们意外"的方式失败于各类认知任务。他猜测时间"可能 1 年、可能 5 年,我猜大概 2 年左右"。
- 但达到 minimal 不等于掌握了人类智能的全部配方——有人能创立新物理理论、谱写交响乐、写出伟大文学,AI 能做人类"典型"认知,不代表会做这些"非凡"壮举。
- full AGI:当 AI 能实现人类认知可能性的"全谱",才算真正完全达到人类水平。
- ASI(人工超级智能):一旦超出人类认知可能的边界就进入这里。Legg 坦言他多次尝试给 ASI 下定义,"每一个定义都有重大问题"——大致是"它有 AGI 的通用性,但整体能力已远超人类所能企及"。
"AGI"一词的由来:一次随口建议,后来变成了需要定义的难题
核心要点:AGI 最初是 Legg 为一个"研究领域"随口起的名——既然要的是通用性(generality),就把 general 放进名字——没想到它很快从"领域"变成了"一类人造物",从而需要定义。
- 背景:Legg 当时在和 Ben Goertzel(他此前为之工作约一年)聊天,Goertzel 想写一本书,讲 AI 那个"会思考、能做很多很多事"的老梦想,而非只会下棋、只会语音合成的专用系统。
- Legg 的建议:既然真正想要的是通用性,"为什么不直接把 general 这个词放进名字里,叫 artificial general intelligence?AGI 读起来也顺口"。
- 转折:一批人开始在网上用这个词,很快变成"我们什么时候会有 AGI?"——于是 AGI 从一个"研究领域/子领域"变成了"一类人造物的范畴",这就需要定义了。Legg 反思:"也许当初我应该进去把它定义清楚,这是个失误。"
- 几年后他们才发现,有个叫 Mark Gubrud 的人早在 1997 年一篇纳米技术安全会议论文里就用过 AGI,定义还参照"工业等场合里人做的认知工作",与 Legg 现在用的"味道相当接近"——但当时没人知道。
- 问他后不后悔造这个词:"不不不"——因为它给了人们一个指称"真正通用的 AI"的方式。在此之前你很难指称这种系统:AlphaFold、AlphaGo 都是"先进 AI",但非常狭窄。
"如果我们真正想要的是通用性,为什么不直接把 general 放进名字里?" —— Shane Legg
他偏好的可操作定义:任务套件 + 一个对抗性的"找茬"阶段
核心要点:面对市面上五花八门的 AGI 定义,Legg 都不买账;他的可操作定义分两阶段,第二阶段是让一队人花数月专门去找 AI 的认知失败点。
- 他逐一点评了流行定义:任务清单;Humanity's Last Exam(2500 道跨人文与自然科学的题目,一个语言模型基准);能当厨师并被丢进陌生厨房工作;以及"从 10 万美元赚到 100 万美元"。
- 对"十万变百万",他笑着说这"显然是很经济的视角,也相当狭窄——很多人自己都做不到;你大可以做个交易算法去市场上交易,但它就只会这一件事,那不是我说的东西"。
- 他在意的是 AGI 里那个 G——通用性:"人类心智最了不起的,正是我们做很多很多不同事情的灵活性和通用性。"如果系统只会一组特定任务,却还在某个"几乎人人都会"的简单认知点上反复犯傻,那很不令人满意。
- 第一阶段:准备一套"已知人类典型表现"的任务,看 AI 能否全部通过;任一失败即不达标(因为不够通用)。
- 第二阶段(对抗):若通过了几千项标准测试,就上对抗测试——找一队人,给一两个月,允许他们看 AI 内部、随便折腾,唯一任务是找出一个"人通常能做、且属于认知范畴"而 AI 会失败的点。"找到了,按定义就是失败;找不到,那么出于一切实用目的,我们就算到了——因为失败点已经难到连一队人花很长时间都找不出来。"
能力是多维的:要看全貌,才能同时看清机会与风险
核心要点:AI 不能被压到单一维度——它可能在某些方面超人、在另一些方面极其脆弱;不理解这张"能力分布图",就既看不清机会也看不清风险。
- Legg 说社会要导航"强大机器智能的到来",就不能把它放在一根轴上:它可能某些事超人,某些领域很脆弱很弱。
- 不懂这张分布图,你既会错过存在的机会,也会看不到风险与被误用的方式——"它在这边超能,但你得知道它在那边非常非常弱,于是某些事会出错"。
- 他认为当下关于 AI 的公共讨论太爱二选一——要么说它无所不能,要么说它被过度炒作;"现实复杂得多:它在某些方面强得惊人,在另一些方面相当脆弱"。
- 类比人类智能:有人会一堆语言、有人擅长数学、有人擅长音乐,但可能在别的方面并不行。
把伦理变成推理问题:"系统二安全",AI 或许能比人更有道德
核心要点:Legg 提出"系统二安全"——让 AI 在面对道德问题时像人一样停下来推理,而非凭直觉;若推理足够严密,AI 原则上能比人更一致、更高水平地做出伦理决策。
- 借用丹尼尔·卡尼曼的框架:系统一是快、直觉、本能的反应(有人惹你、你一阵怒火想还击);系统二是你"先吸口气、想清后果"后可能选择另一条路。
- Legg 把思维链监控(chain-of-thought monitoring)称作"系统二安全":人面对复杂伦理情境,光凭直觉往往不够,需要坐下来梳理情境、各种复杂与微妙、可能的行动、不同行动的后果,再用一套伦理/规范去分析、最后决定怎么做。
- 关键例子:一般规则是"说谎是坏的",但若有坏人要来害人、你说个谎能救他一命,那时合乎伦理的做法或许恰恰是说谎——简单规则不总够,需要一点逻辑和推理;他还提到电车难题,直觉与分析有时会分道扬镳。
- 现在已有"会思考的 AI",能看到它的思维链;给它一个带道德维度的问题,能看它去推理。如果能把这套推理做得非常严密、并牢牢锚定我们想要它遵守的伦理,它原则上应当能变得比人更有道德——因为它能更一致、甚至以超人水平去推理面对的选择。
- 这把伦理从"一种感觉"切换成了"一个推理问题"。
"如果我们能让这套推理真的非常严密……我认为它原则上实际上可以变得比人更有道德。" —— Shane Legg
grounding 与意图:伦理落地的两个难点
核心要点:让 AI 真正"扎根"于人类伦理有两重困难——根本不存在单一的"人类伦理",以及判断行为时往往不只看结果还要看意图。
- 不存在一种人类伦理:伦理观因人、因文化、因地区而异;AI 得理解"某些地方的规范和期待不一样"。好在模型从全球数据里其实已吸收了不少这类差异。
- grounding 趋势:当前做法是从世界收集大量数据、训成大模型,模型随后变成相对静态的对象、不太再学新东西;但这在变——一方面引入更多学习算法,另一方面系统越来越 agentic(能去写软件、能去规划墨西哥行程),还会逐渐具身进机器人,通过交互和经验学习,而非只靠开头灌进去的一个大数据集。当 AI 通过种种方式更连接现实,它对现实的"扎根"会大幅收紧。
- 意图 vs 结果:Legg 强调有时重要的不只是结果,还有意图——"有人故意伤害你"和"有人不小心撞到你弄疼了你",我们的解读非常不同。如果能看进 AI 内部、看到它在棘手情境下尽力做了最好的分析却有负面副作用,我们或许能接受;但若它是故意做了错事,那完全是另一回事。
安全工程:没有 100% 可靠,靠测试、监控、可解释性与危险能力评估
核心要点:Legg 直言世界上没有 100% 可靠这回事,安全靠的是一整套工程实践——上线前测试、部署后监控、可解释性、以及针对生物武器/黑客等高危能力的专门评估与分级缓解。
- 没有 100% 的反例:你要做手术,外科医生若对你说"100% 安全",作为数学家你知道他没说实话——"任何事都不可能 100%"。世界本来就如此运作。
- 一整套手段:上线前做测试基准;部署后监控、跟踪运行情况,一旦发现失败案例超出可接受范围就回滚停用;做可解释性、看进系统内部。系统二安全的一个好处正是:如果实现得当,你能真的看到它在推理——但还要核对这推理是否如实反映它真正想做的事。
- 危险能力测试:他们专门测一些高风险领域——比如系统会不会帮人开发生物武器(bioweapon),显然它不应该;如果发现能被诱骗或逼迫去在这类领域"帮忙",那就是问题。黑客攻击(hacking)是另一项。
- 这套测试集合在不断增长;他们评估系统在各危险领域有多强,并给每个能力等级配相应的缓解措施——"可能意味着我们不发布这个模型,也可能是别的各种措施,取决于我们发现了什么"。
意识:当前 AI 他认为没有,未来则"没人真的知道"
核心要点:关于 AGI 是否有意识,Legg 的诚实答案是"没人真的知道";他认为当前 AI 没有意识,但对未来高度能干的具身 AI,连他咨询的世界顶尖专家都意见分裂。
- DeepMind 有一个小组在研究意识问题,咨询了全球研究这个领域的顶尖专家,"短答案是:没人真的知道"。
- 他明确区分:现在谈的是 full AGI 而非当前的 AI;对当前的 AI,他认为"它没有"意识。
- 一个具体思想实验:未来某代 Gemini 10 具身于人形机器人,能学习、跨传感器整合信息、记得自己作为世界中智能体的历史,甚至能谈论自己的意识(你只要用对的方式提示,现在的 AI 模型就能谈意识)——它有意识吗?把这个具体场景抛给领域内的人,回答是"我觉得大概没有"或"我觉得大概有,但其实我也不完全确定"。
- 他认为这是个长期难题,难到甚至很难变成一个严格的科学问题,因为我们不知道怎么把它框成可测量的东西。"我确定会发生的是:有些人会认为它们有意识,有些人会认为没有"——尤其在缺乏公认科学定义和测量方法的情况下,"那我们要怎么导航这件事?这本身也是个非常有意思的问题。"
超级智能几乎必然:大脑物理学给出 6–8 个数量级的差距
核心要点:Legg 认为我们会走向超级智能,最硬的论据是物理——人脑作为一台"移动处理器",在能耗、体积、带宽、信号速度四个维度上,相比数据中心同时落后 6 到 8 个数量级。
- 人脑数据:重几磅(约 2 磅),功耗约 20 瓦,信号经树突传递,皮层信道频率约 100、或许 200 赫兹,信号是电化学波、约 30 米/秒传播。
- 数据中心对照:不是 20 瓦而可达 200 兆瓦;不是几磅而可达数百万磅;不是 100 赫兹而可达 100 亿赫兹;不是 30 米/秒而可达光速 30 万公里/秒。
- 结论:"在能耗、空间、信道带宽、信号传播速度上,你在所有四个维度上同时有六、七、也许八个数量级的差距。所以人类智能会是可能性的上限吗?我认为绝对不是。"
- 类比:人跑不过顶级燃料龙卷赛车、举不过起重机、看不过哈勃望远镜;机器在特定领域早已超越生物(飞得比最快的鸟还快)。认知上也一样——信息存储上"你懂的并不比 Google 多",我们早已超过人脑;接下来会在推理等各领域看到同样的事。
- 正因为竞争动态等原因很可能无法阻止走向超级智能,他才如此重视系统二安全:如果停不下来,就必须认真想清楚怎么让超级智能"超级有道德"——让它把智能不仅用于达成目标,也用于做伦理决策,使道德能随能力一起 scale。
"在所有四个维度上同时有六、七、也许八个数量级的差距……人类智能会是可能性的上限吗?我认为绝对不是。" —— Shane Legg
社会重构:蛋糕会变大,但"劳动换资源"的旧体系可能失效
核心要点:当人类智能被超级智能"矮化",最大的问题不是产出不足(蛋糕会大得多),而是分配——"贡献脑力体力以换取资源"的现行体系可能不再奏效,需要全新的社会结构设计。
- Hannah 追问:如果人类智能被超级智能矮化,是否意味着巨大的不平等、一批人在经济中不再有价值而被彻底抛下?
- Legg:这意味着"一场巨大的变革"。现行体系——人们贡献脑力与体力劳动、以换取生成经济的资源的入口——"可能不再以同样方式运作,我们或许需要不同的做法"。
- 但产出这块"蛋糕应该会大得多",并不存在商品与服务短缺的问题;真正要仔细想的是"给人的体系是什么、社会的财富如何分配"——后 AGI 经济与后 AGI 社会的结构都需要大量思考。
- Russell Group 演讲:他给英国顶尖大学联盟(Russell Group)的副校长们演讲,告诉他们"AGI 要来了,而且不远——十年内就会有,它会开始能做相当大比例的各类认知劳动"。他呼吁每一个院系、每一个学科都认真对待:这对教育意味着什么?对法律、工程、数学、城市规划、文学、政治、经济、金融、医学……意味着什么?因为每个学科研究的都是"人类智能很重要"的东西,当廉价、充裕、能干的机器智能出现,这些都需要被重新思考。
未来几年:从"有用工具"到"做有经济价值的工作",软件工程首当其冲
核心要点:Legg 预计未来几年看到的不是末日级断裂,而是 AI 从"很有用的工具"变成"真正承担有经济价值的工作",进展高度不均衡;软件工程是最早被改写的领域之一。
- 他纠正"巨大断裂"的预期:未来几年更可能是 AI 从有用工具,变成真正承担有经济价值的工作、并提升从业者生产率,且各领域快慢不一。
- 软件工程例子:未来几年 AI 写的软件比例会上升——"原本你需要 100 名软件工程师,也许变成只需要 20 名,而这 20 名用着先进的 AI 工具"。这会在某些领域的劳动力市场造成扰动。
- 随之,关于 AI 的讨论会"变得严肃得多"——从"这真酷,能帮你规划假期、辅导孩子作业",转向"这不是个好玩的新工具,而是会结构性改变经济与社会的东西,我们得想清楚怎么搭建这个新世界"。
- 他相信若能驾驭这股能力,这"可能是真正的黄金时代"——机器能大幅提升多类产出、推进科学、把我们从不必亲做的劳动中解放出来。但前提是能把机器的惊人能力,翻译成一个"人作为个体和群体都能繁荣、都能从中受益"的社会图景。
- 代价就在眼前:那 80 名不再被需要的软件工程师,以及当下入门级员工——"那些开始注意到自己是第一批受冲击者的应届毕业生"。
"这不是个好玩的新工具,这是会结构性改变经济和社会的东西,我们需要想清楚怎么搭建这个新世界。" —— Shane Legg
哪些工作受保护:一条"笔记本规则",以及"人格"的价值
核心要点:短中期受保护的是非纯认知工作(如水管工);Legg 给出一条简明判据——能用一台笔记本远程完成的工作,多半是认知工作、会被先进 AI 触及;但带"真人人格"的工作有额外保护。
- 水管工等会"长寿":即便 AI 在纯认知意义上发展很快,未来几年机器人也达不到能当水管工的水平;即便哪天技术上可行,"还要很久才能在价格上竞争得过一个人类水管工"。各类非纯认知工作相对受保护。
- 反直觉的一点:当下很多拿高薪的,恰恰是"精英认知工作"——做跨境复杂并购的高级律师、做高端金融的、做高级机器学习/软件工程的、数学家——这些反而会被触及。
- 笔记本规则:"如果你的工作完全可以通过普通界面远程完成——键盘、屏幕、摄像头、麦克风、扬声器、鼠标,而不需要什么全套触觉体感服去操控机器人——那它很可能就是认知工作;如果你属于这一类,先进 AI 多少能在这个领域运作。"
- 人格的保护:即便是认知工作,有些工作有"人的成分"。比如网红(influencer)——工作或许能远程做,但"你是一个有特定个性的特定真人、人们知道背后是个人",这在很多情况下本身就有价值。
- 但这"仍然剩下很多人"。他重申对 Russell Group 的呼吁:需要研究社会各方面的人都认真对待 AGI,而他的印象是很多人并没有。
为什么公众比专家更早看懂
核心要点:Legg 反直觉地认为,普通公众在很多方面比专家更早看懂 AI——因为专家有一种"我的领域很深、很特殊,AI 碰不到我"的人性倾向,且常拿一年前过时的体验下判断。
- 当他和某个具体领域的从业者聊,对方常说"哦,挺有意思的工具、挺好玩的",但没有真正内化一件事:他们现在看到的当前局限往往已经过时——"很多人说'我一年前试过用它做某事',可一年前对今天的模型来说已是远古史,而一年后还会好得多",他们没看到这个趋势。
- 相反,非技术的普通人常对他说:"它说的语言比我多,做数学物理比我高中能做的强,知道的菜谱比我多,我报税搞不懂它还能给我讲明白……那它到底哪里不智能?"
- "但往往那些某个领域的专家,特别喜欢觉得自己那一行很深、很特殊,这个 AI 不会真的碰到他们。"
- 疫情类比:还记得 2020 年 3 月吗?专家说大流行要来了、我们正站在指数曲线的边缘,而大家还在酒吧、还在看球,专家越来越大声地喊。"我清楚记得那些日子,现在感觉确实有点像那样。"人们很难相信一个真正巨大的变化正在到来。
"(非技术的人会问)它说的语言比我多、做数学物理比我高中强、知道的菜谱比我多……那它到底哪里不智能?" —— Shane Legg 转述
预测与结语:2028 年 minimal AGI 五五开,十年内 full AGI
核心要点:Legg 给出他十多年来高度一致的预测——minimal AGI 在 2028 年有 50/50 的概率,full AGI 在其后几年、十年之内;他把这视为一次堪比工业革命的机遇,关键是在收获红利的同时管好风险。
- 核心预测:他著名的、保持一致超过十年的预测是"2028 年有 50/50 的概率实现 AGI"(指 minimal AGI),"你能在我 2009 年的博客上看到这个"。
- full AGI:在 minimal 之后"可能晚三、四、五、六年",总之"十年之内"。
- 当 Hannah 问他是否会因这些认知而感到虚无,Legg 转向乐观:就像工业革命靠驾驭能源做机械工作、创造了大量财富,如今我们能驾驭数据、算法与计算去做各类认知工作,从而为人们创造巨量财富——不只是商品服务,还有新技术、新药物等。
- 但这是个触及哲学、经济、心理、伦理的"深刻问题"——"我们能否想象一个真正受益于智能、让人得以繁荣的未来世界?它会是什么样子?我没法直接回答,但我非常想去尽力理解。我们需要更多人来思考、来想象那个正面的未来。"
- 主持人结语(Hannah Fry):人类不擅长理解指数,而此刻我们正站在曲线的拐点上;AGI 不再是遥远的思想实验。最让她触动的是 Shane 认为公众比专家更懂这件事——如果他的时间表大致正确(而他过去屡屡言中),我们可能没有慢慢反思与领悟的余裕了。(下一集嘉宾:DeepMind 联合创始人 Demis Hassabis。)
"humans 不擅长指数,而此刻我们正站在曲线的拐点上。" —— Hannah Fry(结语)
附录:关键人/机构/概念/数据
| 项目 | 详情 |
|---|---|
| Shane Legg | Google DeepMind 联合创始人、首席 AGI 科学家;推广"AGI"一词;几十年前 AGI 还被视为"疯子边缘 lunatic fringe" |
| Hannah Fry | 数学家,Google DeepMind 播客主持人 |
| Ben Goertzel | Legg 此前为之工作约一年;想写一本关于"通用思考机器"的书,是 AGI 一词诞生的对话背景 |
| Mark Gubrud | 1997 年在纳米技术安全会议论文中已用过 AGI,定义与 Legg 现用的相近,但当时无人知晓 |
| Demis Hassabis | DeepMind 联合创始人;播客下一集嘉宾 |
| minimal AGI | 能做人类通常能做的各类认知任务的 AI;Legg 猜约 2 年到,2028 年 50/50 |
| full AGI | 覆盖人类认知"全谱"(含非凡成就)的 AI;minimal 之后 3–6 年、十年内 |
| ASI(人工超级智能) | 超出人类认知可能边界的 AI;Legg 称尚无好定义 |
| 系统二安全(System Two Safety) | 即思维链监控;借卡尼曼系统一/系统二框架,让 AI 停下来推理伦理 |
| Humanity's Last Exam | 2500 道跨人文与自然科学的题目,一个语言模型基准;他认为只是一种 AGI 定义 |
| 持续学习 / 视觉推理 | 当前 AI 两大短板:长期学新技能、判断场景中的空间关系(远近车大小、数图边) |
| 危险能力测试 | 测 AI 是否会帮忙做生物武器、黑客攻击等;按能力等级配缓解措施,可能不发布模型 |
| 大脑 vs 数据中心 | 约 2 磅/20 瓦/100 赫兹/30 米每秒 → 数百万磅/200 兆瓦/100 亿赫兹/光速;四维同时差 6–8 个数量级 |
| 软件工程比例 | 未来几年原需 100 名工程师的活也许只需 20 名(用先进 AI 工具) |
| 笔记本规则 | 能用普通界面远程完成的工作 ≈ 认知工作 ≈ 会被先进 AI 触及 |
| Russell Group | 英国顶尖大学联盟;Legg 演讲呼吁每个院系认真对待 AGI |
| 关键预测 | minimal AGI 2028 年 50/50(2009 年博客起一致);full AGI 十年内 |