← 返回
203 min 2025-12

124. 年终回顾【站在2025年之外】和戴雨森聊2026年预期、The Year of R、回调、我们如何下注 - 张小珺Jùn|商业访谈录

报告概述

本报告基于《商业访谈录》第124期播客内容,系统性地梳理了2025年全球人工智能领域在技术落地、创业生态、投资逻辑与未来趋势等维度的关键进展与深刻洞察。报告以“站在2025年之外”为视角,全面复盘了从“技术实验”迈向“生产力落地”的关键跃迁,揭示了AGENT(智能体)从概念验证走向真实场景应用的实质性突破,同时深入剖析了多模态生成技术如何重塑内容创作范式,以及AI逻辑推理能力提升对行业应用的深远影响。报告指出,2025年并非“AGENCY元年”的全面爆发,而是一个从零到一的实质性落地阶段,其核心标志是垂直场景中可验证的自动化工作流的实现,而非泛化能力的全面成熟。这一判断源于对早期AutoGPT等思想实验的反思,以及对当前模型推理能力和工具调用接口成熟度的客观评估。

报告进一步聚焦中国AI创业生态的崛起,揭示出中国应用出海表现卓越的根本原因在于其“第一天就是国际化”的基因,这得益于大语言模型天然具备的多语言通晓能力,以及中国创业者在长期实战中积累的“打仗经验”、执行力与产品设计能力。报告强调,中国创业者在通用型应用领域,尤其是面向PROSUMER和SMB市场的竞争力尤为突出,其成功不依赖于地缘政治因素,而在于“谁把产品做好,谁给用户的结果好”这一根本法则。在此基础上,报告前瞻性地提出2026年将是“R之年”(Year of R),其核心内涵是“回报”(RETURN)、“研究”(RESEARCH)与“记忆”(MEMORY)三重驱动。报告认为,巨大的前期投入要求未来必须有清晰、可预期的商业回报来支撑,而单纯的技术迭代已进入瓶颈,真正的突破将依赖于底层研究范式的革新,如在线学习或世界模型等关键研究突破。与此同时,构建持久、个性化的“记忆”系统将成为应用差异化的核心壁垒,这不仅是技术层面的挑战,更是用户体验与商业价值创造的关键。最终,报告通过对产品形态演进、投资策略与风险判断的深度分析,勾勒出一幅从“对话框”到“沙盒环境”的根本性变革图景,并为投资者与创业者提供了在泡沫与机遇之间寻找平衡的行动指南。

一、2025年核心趋势:从“技术实验”到“生产力落地”的关键跃迁

核心观点一:AGENT(智能体)已进入从零到一的实质性落地阶段,但远未达到“元年”的全面爆发预期

尽管2025年被普遍称为“AGENT元年”,但实际进展表明,这并非一个能实现全面商业化和规模化应用的“完成年份”。真正的突破在于部分垂直场景中实现了可验证的自动化工作流,而非泛化能力的全面成熟。这一判断源于对早期技术发展路径的深刻反思:2023年以AutoGPT等为代表的AGENT思想实验,受限于当时模型能力低下,无法真正执行复杂任务,更多停留在理论探讨层面。然而,随着模型推理能力和工具调用接口的成熟,当前的AGENT已具备初步自主性,能够独立拆解目标、规划路径、调用工具并根据反馈调整动作,其行为模式已趋近于真人工作流程。> “所以当我们要提到AUTONOMOUS,要提到AGENT的时候,它往往都是一个比较长期的过程。它可以很快的给你一个比较有意思的DEMO啊。当时安居开巴斯就说他十几年前他就做了自动驾驶L4的车,开了几可能几英里,他觉得哇,这个东西好像非常的成熟了,很快就可以用。但实际上我们现在做过L4级别ROBOT TAXI的人还是非常少。”

这种从“零到一”的实质性落地,主要体现在对特定重复性、流程化任务的自动化处理上,其成功与否高度依赖于任务的结构化程度和可预测性。当前AGENT的核心价值并非替代所有人类工作,而是解放白领在繁琐、耗时的事务性劳动上的精力,使其专注于更高价值的创造性与决策性工作。> “MANAS和JANSPARK在这个办公领域啊,在这种对于知识的处理、呃文件的数据的处理、做PPT这几些领域呢,确实实现了说给他一个PROMPT,然后他自己完成给到一个好的结果。” 这一现象在多个具体案例中得到印证。例如,MANAS与JANSPARK在办公领域的应用,用户只需输入一个自然语言指令(如“帮我做一个关于Q4市场分析的PPT”),系统即可自动完成资料搜集、内容生成、视觉设计等全流程操作,最终输出高质量成果。这不仅极大地提升了效率,更改变了传统办公模式,使信息处理从被动响应转向主动创造。

另一个典型代表是CLOUD CODE系列编程AGENT的应用,它使开发者能够通过简单提示(prompt)让AI完成代码编写、调试和优化,实现了“AI去干活,人不用动”的L3级体验。> “CLOUD CODE啊,这些为代表的CODING AGENT,我觉得也是让大家看到了说AI去干活,人不用去动的这种所谓L三级的体验啊。” 这种能力的实现,标志着AI已从简单的代码补全工具,进化为能够理解上下文、进行多步骤规划并执行复杂开发任务的“数字同事”。值得注意的是,这种落地并非一蹴而就,其背后是持续的技术迭代与数据积累。例如,MANAS在由SCALE发布的REMOTE LABOR INDEX测试中,其表现超越了所有主流先进模型,这证明了其在复杂任务执行上的优越性,也凸显了其在模型之上构建的专有框架与工程能力的价值。因此,2025年的核心特征不是“元年”的全面爆发,而是一个从“尝鲜者市场”向“主流市场”过渡的起点,其成功的关键在于能否提供足够易用且结果可靠的产品,从而赢得普通白领用户的信任与采纳。

核心观点二:多模态生成技术取得长足进步,虚拟与现实的边界正被重新定义

2025年,图像和视频生成技术不再仅仅是炫技,而是开始展现出改变内容创作范式的能力,其社会影响力远超技术本身。在图像生成领域,以CHATGPT 4.0 NANO BANANA为代表的模型,已能稳定生成高保真、风格化的图像,引发了全民参与热潮。> “每次这方面的进步也会火遍全网对吧?我记得在年初的时候,有一阵子是大家都在做自己的吉布利头像,然后后面是每个人都在和自己和SAM一起呃做点什么拍视频对吧?” 这种现象不仅反映了技术的成熟,更揭示了用户对个性化、互动性内容的强烈需求。从最初制作吉布利风格的头像,到后来与AI角色(如SAM)共同创作短视频,用户的行为轨迹清晰地展示了从单向消费到双向共创的转变,这正是多模态技术赋能内容生态的生动体现。

在视频生成领域,以SORA TWO和VO THREE为代表的模型发布,标志着技术进入新纪元。尽管初期留存率低,但这并非产品失败,而是因为其应用场景并非传统消费型内容平台。> “虽然大家现在看到SORA留存很低,但是那是因为它的它不是个消费内容的地方,但是。它这种卡米尔生成的内容效果,其实很让很多人第一次看到了呃,虚拟和现实的边界正在被被消散啊。” 这种体验具有强烈的“魔法般”冲击力,是推动技术普及的核心驱动力。当用户首次看到由AI生成的、具有电影级质感的视频片段时,那种对现实认知的颠覆感,正是技术价值最直接的证明。这种“虚拟与现实的边界正在被消散”的感受,是任何参数指标都无法衡量的深层心理效应,它激发了用户探索和创造的欲望,为后续的广泛应用奠定了情感基础。因此,2025年多模态技术的突破,其意义不仅在于生成质量的提升,更在于它重新定义了人与内容的关系,将创作者从繁重的技术操作中解放出来,使创意表达成为人人可及的日常行为。

核心观点三:AI逻辑与推理能力的提升,是驱动行业应用落地的根本动力

模型能力的进化不仅是参数量的增长,更是其内在逻辑链构建和复杂问题求解能力的飞跃,这是将AI从“问答工具”推向“决策伙伴”的关键。推理能力的提升使得AI能够理解更复杂的上下文,并进行多步骤的规划与执行,从而胜任律师、客服等白领岗位的替代性工作。> “因为AI的逻辑能力、推理能力提升呢,所以我觉得在行业里面其实它的落地的能力也变得更强了。” 这种能力的提升,使得AI能够处理非线性的、需要跨领域知识整合的任务,而不仅仅是回答预设的问题。

在美国,哈维(Harvey)代表的法律AI,以及CARRA、DEACON等代表的客服AI,已成为企业服务领域的标杆应用,证明了AI在高价值和劳力密集型白领岗位上的可行性。这些应用的成功,源于其对特定行业工作流的深度理解,能够模拟专业人员的思维过程,进行事实核查、法律条文检索和客户情绪分析。在中国,投资组合中的黑狐公司(Black Fox)专注于将AI应用于制造业,其核心竞争力在于利用AI对工厂生产流程进行深度拆解和优化,这需要超越通用知识的专有领域理解。> “比如我们投了黑狐这家公司,它是。在工厂里面怎么样把一个制造业的任务拆解成对应的工序啊。” 这种能力的实现,依赖于对工业现场数据的深度挖掘和建模,是通用模型难以企及的。因此,AI在行业落地能力的增强,其根本驱动力正是逻辑与推理能力的提升,它使得AI能够从“知道什么”走向“理解为什么”和“如何做”,从而真正融入业务流程,创造可量化的经济价值。

二、中国AI创业生态:出海优势与全球竞争格局的重塑

核心观点一:中国AI应用的出海表现卓越,成为全球市场的重要力量

2025年,中国AI应用在全球市场的渗透率和影响力显著提升,其成功源于独特的“第一天就是国际化”的基因。这一优势的形成,首先归功于基于大语言模型(LM)的应用天然具备多语言通晓能力,使其无需经历传统出海所需的漫长本地化过程。> “因为在现在基于LM的应用呢,它第一天就是国际化的啊。” 这意味着,一个中国团队开发的AI工具,可以瞬间触达全球数亿使用英语、中文、西班牙语等语言的用户,极大地降低了市场进入门槛。

其次,中国创业者在过去积累的“打仗经验”、执行力和产品设计能力,使其在面对全球市场时具备独特优势。> “因为中国应用创业者在过去其实积累了很多不管是打仗的经验、执行力。” 这种在激烈竞争环境中锤炼出的生存能力,使得他们能够快速迭代产品,高效应对市场变化。根据ANDRESEN发布的TOP50 AI应用榜单,中国公司占据了其中十几个席位,显示出强大的整体实力。> “我们看到ANDRESEN有一个关于呃TOP50这个AI应用的一个榜单,其中中国公司做的有十几个啊。” 这一数据有力地证明了中国AI应用在全球范围内的竞争力。

投资组合中的黑卷(Black Roll)、OPUS CLIP、MANUS、JENSPARK等项目,在年度经常性收入(ARR)排名上均名列前茅,证明了其商业化能力。> “从这个。呃,2021年投的黑卷OPUS CLIP,然后到现在MANUS JEN SPARK这一系列。呃,在ARR的这个排名上都还都还比较靠前啊。” 这些项目的成功,不仅在于技术本身,更在于其对全球市场需求的精准把握和高效的运营能力。因此,中国AI创业生态的出海成功,是技术优势、人才优势与战略眼光共同作用的结果,它正在重塑全球AI市场的竞争版图。

核心观点二:中国创业者在通用型AI应用领域展现强大竞争力,尤其在SMB(中小型企业)市场

中国创业者在通用型应用领域的竞争力尤为突出,尤其是在面向专业消费者(PROSUMER)和中小型团队(SMB)的市场。这一优势的形成,与美国创业者的主流路径形成鲜明对比。> “在美国大部分的应用创业者都是要做垂直行业的,都是要做企业服务的,因为这是硅谷十几年来它这个最赚钱的一个公式。” 美国创业者倾向于深耕垂直行业,这固然能建立深厚的专业壁垒,但也限制了其市场天花板。

相比之下,中国创业者凭借其在通用型产品上的经验和执行力,形成了差异化优势。> “在这种情况稍有水平的就HORIZONTAL的通用应用领域,那么中国创业者其实体现出来很强的竞争力,在TO C上华人有很强的竞争力。” 在这类市场,竞争的核心是“谁把产品做好,谁给用户的结果好”,地缘政治因素的影响相对较小。> “如果我就是一个让你做更好PPT的工具,那这个它最后还是谁把产品做好,谁给用户的结果好,它就能得到更好的应用。” 因此,用户会忽略创始团队的国籍,只关注最终产出的质量。

这一优势在多个案例中得到验证。例如,PLOD在全球实现了超过一亿美元的收入,且全程未融资;另一家名为POLO的深圳公司,也仅靠自有资金做到了二十个MINI RR(可能指月度营收或增长率)。> “比如说PLOD在全球做到了一亿美金以上的收入,其实他之前一直是没有融资的啊。然后我们最近投了一家叫POLO啊,在深圳的公司,他们也是做在线的视频生成,其实对标的也是像美国HIGHSFIELD这样的视频生成公司,但是他之前也是没有融资的,都是自己的钱做起来,做到二十个MINI RR。” 这些案例充分说明了中国创业者极高的经营效率和对成本的极致控制能力,他们能够在资源有限的情况下,依靠产品力和执行力实现快速增长。

核心观点三:中国创业者的竞争优势源于“先发优势”与“高执行力”

中国创业者在2025年取得的成功,是其长期积累的“战争经验”和“高执行力”的集中体现,这使其在快速变化的AI赛道中占据有利位置。> “中国创业者还是执行力很强,呃,挺能打的啊。” 这种高执行力不仅体现在产品开发上,也体现在运营细节上,如对全球市场推广策略的深刻理解。

这种优势的根源在于中国创业者在早期就积累了丰富的实战经验,包括应对激烈竞争、快速迭代产品、高效执行战略等。> “因为中国应用创业者在过去其实积累了很多不管是打仗的经验、执行力。” 这种经验使得他们能够迅速适应市场变化,抓住转瞬即逝的机会。> “所以我觉得这个其实是蛮重要的,就是你能不能够在一个非常快的节奏下,不断地去试错,不断地去迭代,不断地去找到那个正确的方向。”

这种高执行力的体现,不仅限于内部管理,更延伸至对全球市场的深刻洞察。> “大家其实从小就是在用的全球这些优秀的产品成长起来的嘛?那并且大家也天天读的都是伊隆·马斯克、史蒂夫·乔布斯这些呃硅谷创业者的传记,对吧?大家很多时候看的新闻也是呃全球同步的啊。” 这种全球化视野的养成,使得中国新一代创业者,无论是海归还是本土成长,都具备了与国际玩家同台竞技的底气。> “肖红(Xiao Hong)作为MANAS的创始人,在发布前并未去过美国,但他对全球市场的产品设计、审美偏好和运营推广有着深刻洞察。” 这种洞察力,是其成功的关键要素之一。

三、2026年核心主题:YEAR OF R——回报(RETURN)、研究(RESEARCH)与记忆(MEMORY)

核心观点一:2026年是“R之年”,其核心是“回报”(RETURN),即对投资回报的空前关注

2026年将是一个由“投入”向“回报”转变的关键年份。巨大的前期投入(尤其是算力和人力成本)要求未来必须有清晰、可预期的商业回报来支撑。过去几年,英伟达等公司的股价暴涨,吸引了大量资本涌入AI领域,其背后逻辑是“对AI的投资在持续超预期”。> “大家看到的都是像英伟达这样股价的暴涨,包括英伟达上下游对吧?不然ORACLE还是COREVIEW还是上游光模块、呃内存这些。本质上来讲,大家BET的是对AI的投资在持续超预期。”

然而,随着投入规模的扩大,投资者对回报的关注度急剧上升。数据中心的算力投入占总成本的50%,且四到六年就会过时,这迫使投资必须在更短周期内看到回报。> “现在数据中心的算力可能过几年之后啊,这个因为是占大头嘛,差不多一个数据中心里面百分之五十的投入是算力,也就是现在的这些卡呃,它四到六年之后可能就会变得这个这个过时啊。” 这种高投入、高折旧的特性,使得“回报”(RETURN)成为2026年的首要议题。> “所以我觉得这首先是一个2026年是year of return,就是大家要对这个AI投资的回报变得非常的关注。”

核心观点二:回报的实现路径依赖于“研究”(RESEARCH)的突破,而非单纯的技术迭代

当前模型能力的进步已进入放缓期,单纯依靠更大规模的训练(Scaling)难以维持高速增长。真正的突破需要底层研究范式的革新。> “从已有的这些BENCHMARK以及实际落地的场景来看,模型的能力进步也就是新的一代SOTA模型发布之后相比上一代模型的能力进步。是正在放缓的。” 历史规律表明,每一次AI的重大飞跃都始于一次研究范式的变革,随后才带来新的规模化机会。

“所以我觉得第二个R就是说通过RESEARCH的进步啊,我觉得是能够解锁下一波大的RETURN的机会啊。” 伊利亚(Ilya Sutskever)的观点认为,要达到AGI,还需要一到两个关键的研究突破,如在线学习(Online Learning)或世界模型(World Model)。> “因为AI我们看历史上都是一个SCALING和RESEARCH这个交替提高啊,每次是新的PARADIGM拼的研究范式的这个解锁带来了呃SCALING的新机会啊,带来AI能力的提升。” 硅谷涌现出一批被称为“NEW LABS”的新型公司,如THINKING MACHINES、SSI(伊利亚的公司)、REFLECTIONS等,它们以研究员为核心,探索与头部模型公司差异化的AI机会。

核心观点三:记忆(MEMORY)是构建用户粘性和差异化体验的核心壁垒

当前的AI交互仍停留在“一次性对话”层面,而未来的赢家将是那些能建立持久、个性化的“记忆”系统的应用。> “所以我是觉得MEMORY应该是在2026年在AI应用里面大家的一个必争之地。怎么样获得用户尽可能多的CONTEXT和用户有进度的交,尽可能多的交流,从而形成好的MEMORY,然后让应用有差异化。” 目前的MEMORY功能主要基于“检索”(Retrieval),即AI将用户的聊天记录存储为外部笔记,需要时再调用。这是一种初级的、外挂式的记忆。

真正的记忆应是“内嵌式”的,即AI的模型权重会因与用户的长期互动而持续更新,形成对用户深层次的理解。> “所以你不断的能够预测下一个TOKEN,其实你产生了所谓的记忆和智能。但同时也觉得人是很厉害的,因为人其实不需要那么多数据可以圈练,对吧?” 用户与AI的长期互动,如同人类之间的交往,会逐渐形成一种“默契”,这种默契是无法通过简单的数据检索复制的。> “比如同样一个问题,你呃对我来说啊,我问CHATGPT和我问GIMPLE,我得到答案的个性化程度。CHATGPT已经高了很多,因为它有跟我三年以来的所有聊聊天的这些记录和MEMORY啊。” 这种基于长期记忆的个性化体验,是构建用户粘性的核心。

四、AI产品形态的演进:从“容器”到“环境”的根本性变革

核心观点一:当前的CHATBOT形态是AI1.0的产物,但其局限性日益明显

以CHATGPT为代表的CHATBOT,虽然革命性地改变了人机交互方式,但其本质仍是“对话框”式的单一交互界面,无法满足复杂任务的需求。> “所以发现现在也有很多这个产品也是有点像MANAS这么一个结构啊。就是你你这个有一大块像画布啊,或者说一个SAND BOX啊,让AGENT呢自己去操控的环境啊。” 当用户需要AI完成跨多个应用、涉及复杂操作的任务时,如同时操作电脑、浏览器并完成深度调研,CHATBOT的局限性暴露无遗。

历史经验表明,技术的进化必然伴随着产品形态和交互方式的革新。> “其实我们看历史上每一次技术的进化,它不仅仅是技术的进化就能够直接到达这个产品和商业化,它是需要有新的产品和交互的。” 谷歌的PageRank需要一个极简的搜索框,抖音的推荐引擎需要一个上下滑动的界面。因此,当AI需要执行复杂任务时,它需要的是一个全新的“容器”或“环境”,而不是一个简单的对话窗口。

核心观点二:未来的产品形态将演变为“AGENT的沙盒环境”(SAND BOX)

未来的AI应用将不再是被动回答问题的“对话者”,而是主动执行任务的“代理者”。为此,需要一个能让AI自由操作的“沙盒环境”。> “所以发现现在也有很多这个产品也是有点像MANAS这么一个结构啊。就是你你这个有一大块像画布啊,或者说一个SAND BOX啊,让AGENT呢自己去操控的环境啊。” 这个环境应允许AI自主调用各种工具(如浏览器、文件系统、数据库)并改变其状态,从而完成复杂目标。

这种环境的设计理念,类似于一个程序员的工作台,但其核心是AI而非人类。> “曼斯(MANAS)为例,其产品设计正是围绕一个“沙盒”展开,用户可以看到AI在其中如何一步步完成任务。” 字节跳动推出的豆包手机,也是在尝试构建一个全新的AI操作系统环境,尽管目前尚不完善。> “字节跳动推出的豆包手机,也是在尝试构建一个全新的AI操作系统环境,尽管目前尚不完善。” 这种从“对话框”到“沙盒”的演进,标志着AI从“助手”向“伙伴”的根本性转变。

五、投资策略与风险判断:在泡沫与机遇之间寻找平衡

核心观点一:当前的“AI泡沫”是“好的泡沫”,其本质是对未来巨大价值的乐观预期

播客中引用《BOOM》一书的观点,将泡沫分为两类:一类是“未来与现在一样”的坏泡沫(如次贷危机、房地产泡沫),另一类是“未来比现在好很多”的好泡沫(如互联网、AI泡沫)。> “所以从这个角度来讲,我觉得有泡沫我觉得一点都不可怕啊,或者说从人的历史上多么可怕,但是我们要在具体。投资和创业中去规避那种比较明显的泡沫带来的损失。” 当前的泡沫并非源于虚假的价值创造,而是源于对AI将彻底改变生产力、创造巨大新蛋糕的坚定信念。

核心观点二:市场回调不可避免,但应视为“蓄力”而非“破裂”

基于历史规律,当长端(长期预期)与短端(短期业绩)出现错配时,资产价格必然发生大幅波动。> “所以我觉得从二级市场来讲,我觉得明年是有可能出现一个比较大的回调的。” 如果美国劳动力市场出现软化,且AI的回报不及预期,那么OPENAI的用户和收入增长将成为触发市场担忧的关键“TRIGGER”。

核心观点三:投资的核心原则是“投最优秀的创始人”,而非追逐市场情绪

面对市场的剧烈波动,投资机构的唯一安全边际是“优秀的人”。> “但只要我们是投了优秀的人,我们在第一轮投的那这个就是我们的安全边际。因为巴菲特说,安全边际是用合适的价格买入好的资产。” 即使市场悲观,只要创始人足够优秀,其项目依然有潜力;反之,即使市场乐观,平庸的项目也无法持续。

六、未来展望:从“工具”到“伙伴”的终极演进

核心观点一:未来的AI将从“工具”演变为“主动的助理”(PROACTIVE AGENT)

当前的交互模式是“用户主动发起”,而未来的理想状态是AI能“察言观色”,在用户未提出需求时便主动解决问题。> “所以我是觉得MEMORY应该是在2026年在AI应用里面大家的一个必争之地。怎么样获得用户尽可能多的CONTEXT和用户有进度的交,尽可能多的交流,从而形成好的MEMORY,然后让应用有差异化。” 这种能力的实现,高度依赖于对用户上下文(CONTEXT)的深度理解和长期记忆。

核心观点二:长期来看,AI将带来深远的社会变革,但短期需解决“回报”问题

尽管短期面临巨大的投入压力和回报不确定性,但从长期看,AI将重塑整个经济和社会结构。> “所以我觉得从长期来看,我觉得AI带来的变化还会非常大。” 播客中引用“寒武纪大爆发”的理论,比喻AI的突破如同生物进化中眼睛的出现,一旦出现,将引发整个生态的连锁反应。