第26期 - 赛博春节

2026年02月09日

AI貌似让春节变得更忙了

第26期：赛博春节

我前两天看到一句话，讲的是：如果不在工作，那么过年这类型的节假日毫无意义。

非常有感触。因为如果不在工作的话，貌似每天都是节假日，但也失去了节假日作为临时避风港的最大意义。

但今年过年前的这一周，在 AI圈子，特别是 AI大模型的圈子里面，过得实在是太不平静了。

大概率是受到了去年过年期间 DeepSeek R1 爆火的诱惑，或者说是害怕没有感受到某一波浪潮，抑或是过年前把阶段性的成果小小爆发一把。

总之，结果是很多的大模型，关键是性能强劲且各有特色。

比如 Seedance2.0 直接引爆版权大战，效果不必说。

DeepSeek 的新模型，虽然很迟才出了一个不是很正式的公告，但是 “V4-lite” 之后的 V4 正式版应该是板上钉钉的事情了。

接着是紧着除夕发的 Qwen3.5-397B-A17B，性能堪比上一代最强的 Qwen-3-Max。

能想到背后的程序员过年前的一周是有多“充实”。

这几天的最大感受，就是大模型的发展有点儿像“压缩即智能”的翻版。

因为所有的大模型在智能这个维度上已经到了“如何从 91 提升到 92.3”这个阶段。而到了这个阶段，想要得到正向的分数变化，需要付出的可能是更大规模的训练数据收集、几倍于原本模型大小的新模型、一轮又一轮的大投入训练，而结果非常有可能是持平，甚至是下降。

就跟打游戏到了后期升级一样。

前期你随便点一点技能树，体感都很明显：伤害涨一截，容错高一截，爽感也直接拉满。但到了后期，再往上抠那 1 点、2 点属性，代价就开始变得离谱——材料要更多，时间要更久，失败概率还更高，最后可能只是面板数字好看了一点，实战体感却未必有那么大差别。

所以这几天看各家模型你会有一种很强的感觉：大家当然还在卷“更强”，但真正开始拉开差异的，已经不只是绝对分数了，而是风格、取舍和落地速度。

有的卷极限性能，有的卷多模态，有的卷推理，有的卷速度，有的卷成本。表面上看都在追同一个“智能”，实际上已经越来越像不同厂商在做不同赛道的车：有的冲直线，有的拼弯道，有的就是稳定耐开。

这也是为什么我会觉得，这波节前发布潮很有意思。它不只是“谁又发了个新模型”，而是整个行业在告诉你：大模型这件事，已经过了那种只靠一个榜单就能讲完故事的阶段。

某种意义上，这也挺像过年。

小时候觉得年味就是烟花、鞭炮、春联、压岁钱，都是“看得见的东西”；长大以后才慢慢发现，年味很多时候不是那些具体的形式，而是一种很稀缺的状态，你明知道外面的世界还在高速运转，但你被允许短暂地慢下来一下。

哪怕只是一下。

所以回到开头那句话：如果不在工作，节假日好像确实会失去一部分意义。因为“节”这个东西，本质上就是在连续的时间流里，硬生生打一个结。有了平时的忙、赶、追、卷，那个结才会被感知到。

而今年这个年，至少对 AI 圈的人来说，挺魔幻的：一边是家里人催你吃饭、贴春联、看春晚，一边是手机里推送不断，模型一个接一个，参数、速度、榜单、demo 满天飞。某种程度上，推送提示音都快有鞭炮那味儿了。

但也正因为这样，我反而觉得“年味”没有消失，只是变了。

它不一定是你彻底不看工作消息，也不一定是你真的完全放空。可能就是：世界在加速，你短暂靠岸。你知道浪还在来，但这一刻先不下水。

等年过去，推送还会继续响；但至少在这几天，你还能给自己留一小段“靠岸时间”——哪怕只是把手机扣在桌上，去厨房里弄点热乎的东西，闻到一点熟悉的味道。