AGI-Next 2026：从 Chat 到做事的范式转折

范式转移

Chat (聊天) 时代结束，Agent (做事) 时代开启。不再是搜索替代，而是任务交付。

智能效率

Scaling Law 遭遇瓶颈，核心转向 Token Efficiency：用更少算力换取更高智能。

世界观与品味

模型不仅是工具，更承载价值观 (Taste)。强先验将压缩搜索空间，加速 AGI 到来。

20% 反超概率

中美算力结构差异巨大（Research vs Delivery）。中国反超很难，需赌对新范式。

核心观点全景拆解

唐杰智谱 AI 创始人

核心判词：Chat 范式终结

“DeepSeek 横空出世后，Chat 范式的竞争已基本结束。新的范式不再只是‘对话’，而是让每个人真正用 AI 完成一件具体的事情。”

深度技术路径：从 System 1 到 System 2

System 1 (直觉)

依赖大规模预训练 (Pre-training)，通过 Scaling "记住" 海量知识。解决 95% 的日常快速响应任务。

System 2 (逻辑)

依赖 Reasoning、CoT 与强化学习。处理复杂的逻辑推演、长程规划与纠错。这是当前 Agent 能力的核心短板。

关键解法：RLVR

传统 RLHF 依赖人类反馈，噪音大且不可扩展。唐杰提出 RLVR (Reinforcement Learning with Verifiable Rewards) 是关键路径：在数学、编程等“可验证”环境中，模型可以自主探索并获得确定的正负反馈，从而实现自我进化。

杨植麟月之暗面 (Kimi) 创始人

核心判词：Taste 与世界观

“Scaling Law 本质是把能源转化为智能。智能不仅仅是工具，更是一个 NFT，承载着特定的价值观与品味 (Taste)。”

硬核技术栈：Kimi 的 Scaling 秘密

1
Moonlight Muon 优化器： 使用二阶优化器替代传统的 Adam，提升 2 倍 Token 效率（用 50% 数据达到同等 Loss）。
2
QK-Clip 技术： 解决二阶优化器训练中的 Logit 爆炸问题，支撑万亿参数稳定训练。
3
Kimi Linear (线性注意力)： 解决长 Context 下的计算复杂度问题，为超长链路 Agent 提供经济基础。

林俊旸阿里通义 (Qwen) 负责人

核心判词：20% 反超概率

“未来 3-5 年内，中国团队做到全球领先的概率大概在 20%，这已经是非常乐观的估计。”

中美算力结构差异

美国 (OpenAI) Research 优先

中国 Delivery 优先

美国投入海量算力赌“下一代”，中国算力被产品交付占据。突围需“穷则生变”。

Generalist Agent 路线

从训练模型转向训练 Agent。利用多轮强化学习 (Multi-turn RL) 和环境反馈，实现长程推理。同时通过 Omni 模型实现原生的视觉/音频输出。

姚顺雨腾讯首席 AI 科学家

核心判词：ToB 价值逻辑

“对于 ToB 来说，智能越高，代表生产力越高，客户愿付溢价也越高。ToC 则大部分人不需要那么强的智能。”

ToC 逻辑

• 需求：够用就好
• 关键：语境 (Context) 优于极致智能
• 形态：垂直整合 (如 ChatGPT)

ToB 逻辑

• 需求：解决 Top 10% 难题
• 关键：智能 = 生产力 = 现金流
• 形态：模型与应用分层

学界压轴

张钹院士：冷峻的学界审视

91岁泰斗的当头棒喝：当前大模型存在根本性缺陷，AGI 定义必须“可检验”。

五大根本缺失

• 指称缺失：无法建立符号与物理世界的真实对应。
• 因果缺失：缺乏对因果机制的理解，依赖概率相关性。
• 语用缺失：难以理解语言背后的意图与潜台词。
• 多义与动态语境缺失：处理复杂语境变化能力不足。
• 闭环行为缺失：缺乏在真实环境中执行并获得反馈的能力。

AGI 的五大标准

• 时空一致的多模态理解
• 可控的在线学习与适应
• 可验证的推理与长期规划
• 可校准的反思与元认知
• 跨任务的强泛化能力

行业共识 vs 关键分歧

高度共识

• Chat 战场收官，主战场转向 Agent。
• RLVR 与环境反馈是进化的关键。
• 学术界与工程界需更深互补。

关键分歧

反超概率： 姚顺雨(乐观) vs 林俊旸(谨慎)
产品形态： 垂直整合 vs 模型即产品 vs 分层
模型本质： 创造世界观(Taste) vs 解决问题的工具

下一步命题

• 智能效率革命 (Token/算力/训练范式)
• 长链路 Agent 环境与反馈体系
• 原生多模态与记忆 / 持续学习

面向 2026-2027 的行动建议

瞄准最强模型溢价

建立 ToB 现金流循环。瞄准代码、金融风控等可验证场景。

押注非对称技术栈

加大学术合作。在原生多模态、新架构、记忆机制上寻找突破口。

研发指标重构

从榜单分数转向 Token 效率、长上下文性能、Agent 稳定性。

度量体系改革

User Preference + RLVR 联合评估，替代静态刷榜。

重塑风险文化

容忍不确定性投入，让研究员直面用户，敢赌下一代范式。