第26期 - 赛博春节

AI貌似让春节变得更忙了
第26期 - 赛博春节 封面

第26期:赛博春节

我前两天看到一句话,讲的是:如果不在工作,那么过年这类型的节假日毫无意义。

非常有感触。因为如果不在工作的话,貌似每天都是节假日,但也失去了节假日作为临时避风港的最大意义。

但今年过年前的这一周,在 AI圈子,特别是 AI大模型的圈子里面,过得实在是太不平静了。

大概率是受到了去年过年期间 DeepSeek R1 爆火的诱惑,或者说是害怕没有感受到某一波浪潮,抑或是过年前把阶段性的成果小小爆发一把。

总之,结果是很多的大模型,关键是性能强劲且各有特色。

比如 Seedance2.0 直接引爆版权大战,效果不必说。

DeepSeek 的新模型,虽然很迟才出了一个不是很正式的公告,但是 “V4-lite” 之后的 V4 正式版应该是板上钉钉的事情了。

接着是紧着除夕发的 Qwen3.5-397B-A17B,性能堪比上一代最强的 Qwen-3-Max。

能想到背后的程序员过年前的一周是有多“充实”。

这几天的最大感受,就是大模型的发展有点儿像“压缩即智能”的翻版。

因为所有的大模型在智能这个维度上已经到了“如何从 91 提升到 92.3”这个阶段。而到了这个阶段,想要得到正向的分数变化,需要付出的可能是更大规模的训练数据收集、几倍于原本模型大小的新模型、一轮又一轮的大投入训练,而结果非常有可能是持平,甚至是下降。

就跟打游戏到了后期升级一样。

前期你随便点一点技能树,体感都很明显:伤害涨一截,容错高一截,爽感也直接拉满。 但到了后期,再往上抠那 1 点、2 点属性,代价就开始变得离谱——材料要更多,时间要更久,失败概率还更高,最后可能只是面板数字好看了一点,实战体感却未必有那么大差别。

所以这几天看各家模型你会有一种很强的感觉: 大家当然还在卷“更强”,但真正开始拉开差异的,已经不只是绝对分数了,而是风格、取舍和落地速度。

有的卷极限性能,有的卷多模态,有的卷推理,有的卷速度,有的卷成本。 表面上看都在追同一个“智能”,实际上已经越来越像不同厂商在做不同赛道的车:有的冲直线,有的拼弯道,有的就是稳定耐开。

这也是为什么我会觉得,这波节前发布潮很有意思。 它不只是“谁又发了个新模型”,而是整个行业在告诉你:大模型这件事,已经过了那种只靠一个榜单就能讲完故事的阶段。

某种意义上,这也挺像过年。

小时候觉得年味就是烟花、鞭炮、春联、压岁钱,都是“看得见的东西”; 长大以后才慢慢发现,年味很多时候不是那些具体的形式,而是一种很稀缺的状态,你明知道外面的世界还在高速运转,但你被允许短暂地慢下来一下。

哪怕只是一下。

所以回到开头那句话:如果不在工作,节假日好像确实会失去一部分意义。 因为“节”这个东西,本质上就是在连续的时间流里,硬生生打一个结。 有了平时的忙、赶、追、卷,那个结才会被感知到。

而今年这个年,至少对 AI 圈的人来说,挺魔幻的: 一边是家里人催你吃饭、贴春联、看春晚, 一边是手机里推送不断,模型一个接一个,参数、速度、榜单、demo 满天飞。 某种程度上,推送提示音都快有鞭炮那味儿了。

但也正因为这样,我反而觉得“年味”没有消失,只是变了。

它不一定是你彻底不看工作消息,也不一定是你真的完全放空。 可能就是:世界在加速,你短暂靠岸。你知道浪还在来,但这一刻先不下水。

等年过去,推送还会继续响;但至少在这几天,你还能给自己留一小段“靠岸时间”——哪怕只是把手机扣在桌上,去厨房里弄点热乎的东西,闻到一点熟悉的味道。