AGI-NEXT 2026 SUMMIT REPORT

ChatAction

四位顶尖大模型掌门人的深度交锋:“Chat 范式已终结,做事时代正式开启。”

“Chat 落幕,决胜智能效率与环境反馈;中国突围,唯在敢赌新范式。”

范式转移

Chat (聊天) 时代结束,Agent (做事) 时代开启。不再是搜索替代,而是任务交付。

智能效率

Scaling Law 遭遇瓶颈,核心转向 Token Efficiency:用更少算力换取更高智能。

世界观与品味

模型不仅是工具,更承载价值观 (Taste)。强先验将压缩搜索空间,加速 AGI 到来。

20% 反超概率

中美算力结构差异巨大(Research vs Delivery)。中国反超很难,需赌对新范式。

核心观点全景拆解

唐杰

唐杰 智谱 AI 创始人

核心判词:Chat 范式终结

“DeepSeek 横空出世后,Chat 范式的竞争已基本结束。新的范式不再只是‘对话’,而是让每个人真正用 AI 完成一件具体的事情。”

深度技术路径:从 System 1 到 System 2

System 1 (直觉)

依赖大规模预训练 (Pre-training),通过 Scaling "记住" 海量知识。解决 95% 的日常快速响应任务。

System 2 (逻辑)

依赖 Reasoning、CoT 与强化学习。处理复杂的逻辑推演、长程规划与纠错。这是当前 Agent 能力的核心短板。

关键解法:RLVR

传统 RLHF 依赖人类反馈,噪音大且不可扩展。唐杰提出 RLVR (Reinforcement Learning with Verifiable Rewards) 是关键路径:在数学、编程等“可验证”环境中,模型可以自主探索并获得确定的正负反馈,从而实现自我进化。

杨植麟

杨植麟 月之暗面 (Kimi) 创始人

核心判词:Taste 与世界观

“Scaling Law 本质是把能源转化为智能。智能不仅仅是工具,更是一个 NFT,承载着特定的价值观与品味 (Taste)。”

硬核技术栈:Kimi 的 Scaling 秘密

  • 1
    Moonlight Muon 优化器: 使用二阶优化器替代传统的 Adam,提升 2 倍 Token 效率(用 50% 数据达到同等 Loss)。
  • 2
    QK-Clip 技术: 解决二阶优化器训练中的 Logit 爆炸问题,支撑万亿参数稳定训练。
  • 3
    Kimi Linear (线性注意力): 解决长 Context 下的计算复杂度问题,为超长链路 Agent 提供经济基础。
林俊旸

林俊旸 阿里通义 (Qwen) 负责人

核心判词:20% 反超概率

“未来 3-5 年内,中国团队做到全球领先的概率大概在 20%,这已经是非常乐观的估计。”

中美算力结构差异

美国 (OpenAI) Research 优先
中国 Delivery 优先

美国投入海量算力赌“下一代”,中国算力被产品交付占据。突围需“穷则生变”。

Generalist Agent 路线

从训练模型转向训练 Agent。利用多轮强化学习 (Multi-turn RL) 和环境反馈,实现长程推理。同时通过 Omni 模型实现原生的视觉/音频输出。

姚顺雨

姚顺雨 腾讯首席 AI 科学家

核心判词:ToB 价值逻辑

“对于 ToB 来说,智能越高,代表生产力越高,客户愿付溢价也越高。ToC 则大部分人不需要那么强的智能。”

ToC 逻辑

  • • 需求:够用就好
  • • 关键:语境 (Context) 优于极致智能
  • • 形态:垂直整合 (如 ChatGPT)

ToB 逻辑

  • • 需求:解决 Top 10% 难题
  • • 关键:智能 = 生产力 = 现金流
  • • 形态:模型与应用分层
学界压轴

张钹院士:冷峻的学界审视

91岁泰斗的当头棒喝:当前大模型存在根本性缺陷,AGI 定义必须“可检验”。

五大根本缺失

  • 指称缺失:无法建立符号与物理世界的真实对应。
  • 因果缺失:缺乏对因果机制的理解,依赖概率相关性。
  • 语用缺失:难以理解语言背后的意图与潜台词。
  • 多义与动态语境缺失:处理复杂语境变化能力不足。
  • 闭环行为缺失:缺乏在真实环境中执行并获得反馈的能力。

AGI 的五大标准

  • 时空一致的多模态理解
  • 可控的在线学习与适应
  • 可验证的推理与长期规划
  • 可校准的反思与元认知
  • 跨任务的强泛化能力

行业共识 vs 关键分歧

高度共识

  • • Chat 战场收官,主战场转向 Agent。
  • • RLVR 与环境反馈是进化的关键。
  • • 学术界与工程界需更深互补。

关键分歧

  • 反超概率: 姚顺雨(乐观) vs 林俊旸(谨慎)
  • 产品形态: 垂直整合 vs 模型即产品 vs 分层
  • 模型本质: 创造世界观(Taste) vs 解决问题的工具

下一步命题

  • • 智能效率革命 (Token/算力/训练范式)
  • • 长链路 Agent 环境与反馈体系
  • • 原生多模态与记忆 / 持续学习

面向 2026-2027 的行动建议

1

瞄准最强模型溢价

建立 ToB 现金流循环。瞄准代码、金融风控等可验证场景。

2

押注非对称技术栈

加大学术合作。在原生多模态、新架构、记忆机制上寻找突破口。

3

研发指标重构

从榜单分数转向 Token 效率、长上下文性能、Agent 稳定性。

4

度量体系改革

User Preference + RLVR 联合评估,替代静态刷榜。

5

重塑风险文化

容忍不确定性投入,让研究员直面用户,敢赌下一代范式。