当前位置: 首页 » 资讯 » 科技头条 » 正文

字节、阿里、智谱、MiniMax集体卡位“春节档”,都在赌一场开年爆款

IP属地 中国·北京 蓝鲸新闻 时间:2026-02-14 16:21:48


图片来自视觉中国

2月14日讯(记者 武静静)过去一周,AI赛道上,谷歌、DeepSeek、智谱、MiniMax、阿里、字节跳动,几乎在同一时间窗口,密集地投下了它们的新一代模型炸弹。

去年是DeepSeek,今年是谁?AI大模型的"春节档"之战

这不是巧合。一年前的此时,DeepSeek V3的发布意外引爆了全民对AI的认知,开启了中国大模型搅动全球算力格局的叙事。让公众第一次意识到中国模型可能改写全球AI的成本与算力逻辑。那是一场突发的流量事件。

而一年之后,行业已经学会主动制造这样的时刻。Seedance 2.0爆火引发全球关注,把视频模型的能力拉上了新高度,之后字节官宣了新的豆包大模型2.0,谷歌宣布升级Gemini 2.0 Deep Think,DeepSeek开始灰度测试上下文提升10倍的新版本,智谱推出744亿参数的GLM-5,MiniMax拿出号称"为Agent原生设计"的M2.5,阿里的Qwen-Image-2.0发布……

这种密集发布背后,是一个行业共识的变化,也是全年叙事权的起点。"春节这个时间点非常关键。一级市场、二级市场、产业客户,都会在年初重新判断一件事:今年AI会不会继续爆发,谁最有可能跑出来。"一位投资人如是说。

AI开始有了"发布季",对于大模型公司来说,技术能力不仅要存在,还必须被市场"看到"。春节前后的时间点,既是用户关注度的高峰,也是资本与产业重新定价的关键阶段。

一位美元基金投资人则将这波发布称为"叙事权竞争"。"去年是DeepSeek意外引爆,今年是大家都不想再把舞台让给别人。"他表示,大模型行业已经进入头部博弈阶段,技术差距短期内不会出现代际断层,但市场心智会迅速分层。"去年大家讲的是参数、训练成本、性能。今年大家都在讲Agent、讲工作流、讲生产力,这说明一个信号:资本开始真正关心商业化,而不是技术想象力。"

这一波热潮中Seedance 2.0首当其冲,Seedance 2.0的核心突破不在画质,而在工作流:自动分镜、自运镜、多镜头叙事、原生音画同步,并支持跨场景一致性。它不再只是文生视频工具,而更接近一个具备"导演思维"的创作引擎。海外用户的反馈与话题热度,也反映出一个关键变化:视频生成的可控性,已经跨过了实用门槛。马斯克都在X评论"It's happening fast",游戏科学创始人冯骥在测试后直言Seedance 2.0为当前"地表最强"的视频生成模型,并称"AIGC的童年时代结束了"。目前,字节跳动称Seedance 2.0全面接入豆包和即梦产品,同时上线火山方舟体验中心,面向用户开放试用。

在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,2月14日,字节也宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列,在数学和推理能力方面,超越了Gemini 3 Pro在Putnam基准测试上的表现。另外成本方面,其百万tokens输入价格仅为0.6元,相比Gemini 3 Pro和GPT 5.2有较大的成本优势。

近日,阿里也发布了千问最新图像模型Qwen-Image-2.0支持超长文本输入、复杂指令理解,并能够直接生成PPT与信息图,同时具备较强的中文文本渲染能力。其定位已经不再是"生成好看的图片",而是替代部分设计与内容制作流程。

市场在传阿里的新一代模型Qwen3.5也即将发布。有开发者通过代码与社区信息进一步分析认为,Qwen3.5或将开源至少一个2B规模的密集模型,以及一个35B级别的MoE模型。若相关信息最终落地,意味着阿里在开源生态上的投入力度有望进一步加大。

2026,AI开始回答同一个问题:能创造什么价值?

过去两年,行业的核心问题是:谁的模型更大、谁的基准分数更高。而2026年春节档,各家的发布几乎都在回答同一个问题——模型将如何进入真实生产环境。

谷歌把推理能力做成科研基础设施。升级后的 Gemini 3 Deep Think 被明确定位为"推理模式",专门面向科学、研究与工程场景,并首次通过 API 向研究人员和企业开放。其在ARC-AGI-2、Codeforces、IMO等基准上的表现达到金牌或顶级水平,更重要的是,谷歌强调其在物理、化学等科学问题中的实际能力。这意味着Deep Think不再只是能力展示,而是瞄准科研与工程场景的高价值用户群体。

DeepSeek 网页/ APP 正在测试新的长文本模型结构,支持 1M 上下文。而API 服务不变,仍为 V3.2,仅支持 128K 上下文。此外,市场也砸期待V4新模型的到来,野村证券于2月10日发布报告称,预计2026年2月中旬推出的DeepSeek V4模型,不会重现去年V3发布时引发的全球AI算力需求恐慌。V4的核心价值在于通过底层架构创新推动AI应用商业化落地。野村进一步指出,V4预计将引入mHC与Engram两项创新技术,从算法与工程层面突破算力芯片与内存瓶颈。

MiniMax和智谱则全面押注Agent。2 月12日,MiniMax 正式上线最新旗舰编程模型 MiniMax M2.5。直接定位为"为Agent场景原生设计的生产级模型",其编程与智能体性能 (Coding & Agentic) 直接对标 Claude Opus 4.6,M2.5 模型激活参数量仅 10B,在显存占用和推理能效比上优势明显,支持 100 TPS 超高吞吐量,推理速度超国际顶尖模型。发布新模型当日盘中,MiniMax 涨幅一度超过 20%,总市值超 1800 亿港元。

2月11日,智谱推出了新一代旗舰模型GLM-5,GLM-5参数规模扩展至744B,并强化长程Agent任务与复杂系统工程能力,官方称,真实编程环境中的使用体感已逼近Claude Opus 4.5水平。此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型"Pony Alpha"即为GLM-5。该模型首次引入DeepSeek稀疏注意力机制,在保持长文本处理效果无损的前提下,有效降低部署成本并提升Token利用效率。

这更像是一场"技术路线的公开展演"。各家试图回答的,不再只是"模型更强",而是如何落地的问题。此时,谁能在开年拿出最惊艳的演示、最清晰的技术路线、最落地的应用场景,谁就能在新一年占得先机。

从能力演进来看,行业正在迈向"任务智能"。无论是视频生成的高可控性、图像模型的办公化能力,还是编程模型面向复杂工程场景的高效执行,各家实际上都在回应同一个核心问题:AI在真实生产流程中究竟能够创造多大价值。下一阶段的竞争,也将从基准成绩与参数规模,转向生产环境中的稳定性、效率与实际反馈——不再是PPT上的领先,而是业务流程中的可用性。

从技术趋势看,底层架构创新正在成为新的分水岭。无论是DeepSeek围绕系统效率的优化,还是MiniMax以10B激活参数实现高性能与高吞吐,背后都指向同一方向:通过算法与架构层面的创新,突破算力与内存的物理约束。模型能力的提升,正逐步从"堆GPU"转向"提效率"。随着推理成本持续下降,应用层的商业探索空间也将随之打开。与此同时,Agent能力开始从概念层走向执行层。模型不仅能够理解任务,还需要具备拆解复杂目标、持续规划并自主完成的能力。在这一过程中,长上下文、高吞吐、低延迟等工程指标,正在成为决定实际可用性的关键参数。

在多模态方向上,能力同样呈现出明显的工作流化趋势。Seedance 2.0支持多镜头叙事与自动分镜,使视频模型开始具备类似"导演思维"的创作能力;Qwen-Image-2.0则能够根据复杂指令直接生成PPT与信息图,图像模型开始理解结构化办公需求。多模态能力正从单点生成工具,向完整生产流程延伸,逐步具备工业化属性。

如果说去年春节前后,DeepSeek的出圈带有一定偶然性,并意外引爆了市场关注,那么一年之后,行业已经明显进入主动节奏。头部厂商不再等待"爆款时刻",而是通过集中发布建立阶段性预期与市场认知。

2026年的这场春节档,或许只是一个开始。接下来,谁能持续拿出真正进入生产环境的能力,才是决定这一轮竞争格局的关键。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。