唐杰 智谱 AI 创始人
核心判词:Chat 范式终结
“DeepSeek 横空出世后,Chat 范式的竞争已基本结束。新的范式不再只是‘对话’,而是让每个人真正用 AI 完成一件具体的事情。”
深度技术路径:从 System 1 到 System 2
依赖大规模预训练 (Pre-training),通过 Scaling "记住" 海量知识。解决 95% 的日常快速响应任务。
依赖 Reasoning、CoT 与强化学习。处理复杂的逻辑推演、长程规划与纠错。这是当前 Agent 能力的核心短板。
关键解法:RLVR
传统 RLHF 依赖人类反馈,噪音大且不可扩展。唐杰提出 RLVR (Reinforcement Learning with Verifiable Rewards) 是关键路径:在数学、编程等“可验证”环境中,模型可以自主探索并获得确定的正负反馈,从而实现自我进化。