

2026 年的马年春节,AI 的炸药味致使盖过了红包味。
字节、、腾讯险些同期把 AI 大规模推向台前:红包、免单、春晚互动、腹地生存接入……齐在争进口。与此同期,BAT 三家也在基础模子上联接出牌,视频生成(Seedance 2.0)、图像(Qwen-IMAGE-2.0)、、语音模子密集更新,险些莫得空档。
不外,基础模子的扞拒也从字节、阿里、等巨头飞快推广到了 DeepSeek 和「AI 小龙」们。
2 月 11 日晚,DeepSeek 新模子版块全面上线,继续把长高下文与复杂任务才气往前推;险些吞并时辰,智谱推出新一代旗舰 GLM-5,强调 Agent 与编程才气;MiniMax 也带来了 MiniMax M2.5,延续多模态与运用导向门路。
三家险些在吞并时辰点入手,让这场春节 AI 大战的「模子交锋」又升级了一个档位。
巨头双线鼓动,既抢进口也抢模子;创业公司聚焦底层才气,把筹码压在基础模子上。信得过决定 2026 年致使畴昔几年的竞争,正在这里伸开。
春节 AI 大战:前哨发红包,后端拼模子
2 月 12 日,阿里千问文牍「春节 30 亿大免单」上线 6 天完成 1.2 亿笔 AI 下单,用户说了 41 亿次。稍早前,腾讯元宝则文牍春节举止启动 5 天,元宝 AI 生图功能日均调用增长 30 倍,时长增长超 80%。

如若说本年春节 AI 大战前半段是隧说念的进口之争,后半段则是更为复杂,从巨头到初创大模子公司,齐在联接发力基础模子的迭代。
这一丝其实雷科技在之前的报说念《一切为了Agent:千问、阶跃、Gemini打响「3.5模子大战」,春节将成关键节点?》就有提到,包括:
- 国外的 GPT-5.3-Codex 和 Claude Opus 4.6;- 国内也曾发布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0;- 刚刚发布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新;- 还有不得不发的 Doubao 2.0、Qwen 3.5、Gemin 3.5。DeepSeek V4大招还没发,把「长高下文」作念深是亮点
磋商到 DeepSeek 并莫得发布官方博文,这一次更新的 DeepSeek 新模子梗概率不是 V4,而是 V3.2 系列的更新(或为 V3.5)。
不外这也不错看作 V4 发布前的「灰度版」,因为按照 The Information 的最新爆料,DeepSeek V4 里面初步测试露馅,其在模子的编程才气了也曾杰出了 Claude(莫得指出具体模子)。
而从网友们和洽收到的 DeepSeek 复兴来看,DeepSeek 新模子的变化联接在两点:百万级长高下文和常识库更新。

率先是高下文窗口从之前的 128K 径直拉升到了 1M(100 万 Token),你不错一次性把《三体》全集或者一总共这个词款式的代码仓库塞给它。测试露馅,它处理这类长文档的反馈速率相配快,不再需要手动拆分文献。
另外,DeepSeek 新模子的常识库也更新到了 2025 年 5 月,但依然不复古多模态——无法意会图片(笔墨实际以外)和视频,也顺应 DeepSeek 一直坚握的「话语模子」门路:
不追求炫目的多模态,而是把文本推理、工程任务这些高频刚需作念到极致。
而高下文长度的大幅进步,不仅长文档处理与多轮推理才气更深入,表面上也会改善长代码意会、多才气分析等复杂场景扩充进展。
时隔 1 个多月迭代,智谱 GLM-5 把 Agent 推到台前

比较之下,GLM-5 看成原生 Agent 基座模子的升级更具「代际感」。天然距离旧年底发布 GLM-4.7 只是昔日 1 个多月,但智谱年头上市时候预报的新一代模子,如实升级不小。
这一代模子的中枢关键词不再是对话,而是 Agent 与编程才气,也规格也曾光显向「Agent 基础模子」贴近:高下文达到 200K 级别,最大输出可达 128K,模子规模进一步扩大,覆按体系也作念了重构。
但信得过的变化如故发生在才气结构上。
GLM-5.0 被径直打算为可扩充当务的 Agent 模子,强调编程才气、器具调用与长经由扩充。在编程测试中,它也曾能处理款式级代码与调试问题,模子不错拆解需求、调用接口、握续扩充当务,并在多阶段过程中保握方针一致。
继续押注多模态,MiniMax M2.5依然坚握分娩至上

MiniMax 从模子到运用的垂直门路,依旧与前两者拉开距离。
MiniMax M2.5 的升级重心仍然放在多模态与实际生成才气,但强调的一整套多模态才气的鼓动,包括语音生成、音乐生成与文本才气同步进步,强调可径直进入创作与居品经由。
模子继续弃取 MoE 架构,在保握规模的同期戒指推理本钱,更安妥部署在运用侧。语音克隆、厚谊抒发、音乐生成质料的进步,使它更接近「分娩器具」,而不是推理模子。
MiniMax 的定位因此也很流露——不是去比谁最灵巧,而是更偏向让模子在实际分娩重要信得过可用,生成实际、参与创作、进入居品经由。
这条旅途也决定了 MiniMax 的方针不是 benchmark,而是可落地的分娩才气。
三家模子的旅途互异由此变得相配具体:DeepSeek 把长推理才气作念到极致,智谱把模子推向 Agent 工程形态,MiniMax 则把多模态分娩才气作念成基础要领。它们不再围绕吞并套方针竞争,而是在不同才气方朝上构建各自的模子形态。
但共性一样光显。参数规模不再是中枢卖点,聊天体验也不再是主要方针,总共升级齐在指向一件事——模子要能参与真是任务,而不仅是给出谜底。
DeepSeek 炸场一年后,「AI 小龙」位次已巨变
把时辰拨回到旧年春节,DeepSeek-V3 和 R1 的开源发布,冲击了全球 AI 步地,也成为「AI 小龙」阵营的分水岭。
关键不单是「模子很强」,更在于本钱被再行界说。低本钱、高性能的推理模子运行出现后,行业对基础模子的预期眨眼间变了——不单是条目严格覆按出一个模子,而是条目更低本钱的更强模子。

剧烈的模子竞争加快,再加之覆按算力的匮乏,径直激励了「AI 小龙」阵营的光显分化。百川和零一险些也曾退出「前沿基础模子」的主战场:前者转向医疗等垂直所在,后者更多走企业与行业场景门路,更新节拍光显放缓。
当基础模子进入高参加、高密度迭代阶段,唯有少量数团队还能永久承受算力与研发压力。
不外本年的情况又有些不一样,最径直的一丝便是 DeepSeek V4 于今莫得发布。从外部看,可能有两种解释。
一种是技艺层面的现实:推理才气、长高下文、工程深入性这些所在自身难度更高,模子要跨出一整代的差距,需要更长周期,况且之前也传出过 DeepSeek 在覆按过程碰到难题。另一种则是更偏政策性,不单是随着友商全部发布,而是看成压轴登场,酿成宣发上的上风。
{jz:field.toptypename/}还有一个更容易被忽略的变化是:本年春节,DeepSeek 要面临字节、阿里、腾讯在模子上的高强度参加,以及全球模子的快速迭代,最直不雅的例子便是最近引爆全球的字节 Seedance 5.0 视频模子。

天然,还在活跃的「AI 小龙」也在第一线握续鼓动基础模子的迭代,智谱 GLM 和阶跃星辰 Step 更多如故联接在模子,面向行业提供更动进、更实用的基础模子。
MiniMax 和月之暗面 Kimi 则更多主打「模子即运用」,不单打造模子,也在发力我方的原生 AI 运用,MiniMax 更是酿成了一定的居品矩阵,但二者齐在从基础模子到运用进行垂直整合。
这不是粗略的「谁强谁弱」,而是一种更现实的分化。
写在临了
2026 年的春节还没肃肃运行,但大模子下半场的发令枪也曾响得震耳欲聋。
从巨头们的「撒币」进口战,到 DeepSeek、智谱、MiniMax 在初四晚上的模子突袭,这场仗的嘱托变了。人人不再执着于在 Benchmark 上刷分,而是运行比谁能更深地镶嵌真是分娩力:是吞下百万行代码的胃口,是自主跑通工程的双手,如成心会东说念主类厚谊的耳朵。
DeepSeek 此次天然没祭出别传中的 V4,但这记「1M 高下文」的长拳,依然也让不少畅谈 Agent 却处置不了长程系念的敌手感到脊背发凉。而智谱和 MiniMax 的依期对垒,则证据了「AI 小龙」们也曾从旧年的注意反击,转向了更有底气的互异化费劲。
悬念依然存在。DeepSeek 憋了许久的 V4 究竟是在等一个「一力降十会」的压轴时刻,如故在攻克某种未知的技艺天花板?在大厂与小龙的混战中,谁能率先把「模子才气」信得过滚动为「买卖护城河」?
但有一丝是细则的:2026 年,单纯靠「会聊天」也曾拿不到门票了。烟花散去,留在牌桌上的,只但是那些能信得过卷入责任流的狠扮装。



