当前位置: 首页 » 资讯 » 科技头条 » 正文

「AI新世代」R2没等来先发V3.1!DeepSeek深陷大模型“包围圈”热度炙烤

IP属地 中国·北京 编辑:任飞扬 华夏时报 时间:2025-08-22 16:24:05


本报记者石飞月 北京报道

不久前“DeepSeek将于8月中下旬推出R2”的传闻,被证实了一半。8月21日,DeepSeek近3个月没有更新的公众号终于有了新内容,但迎来的并不是大家期待的R2,而是V3.1。尽管据媒体报道V3.1一发布就在HuggingFace趋势榜上排名第三,但不少用户似乎并不喜欢新版本,在DeepSeek的评论区呼吁恢复此前的R1版本。

自从今年一月份发布R1模型,DeepSeek便进入了大众视线,R2也成了与GPT-5一样备受期待的模型,但7个月过去了,R2迟迟没有登场。这段时间里,“难产”的GPT-5终于上线,其它国产大模型上新了好几波,DeepSeek的热度渐渐降低。V3.1能否挽回DeepSeek的热度和访问量目前还未可知,不过大模型厂商之间的比拼是越来越激烈了。

不太符合期待的更新

自今年1月R1模型正式发布,业内对R2的期待便开始了,但两次大规模传闻最后都被证实为半真半假,“真”的是DeepSeek在这两个时间点确实推出了新版本,“假”的是推出的新版本都不是R2。上次传得有鼻子有眼的时间是5月,但当时DeepSeek只是对R1模型完成了一次小版本升级;上周又有消息称8月中下旬R2会来,但最后上线的却是V3.1。

让很多用户失望的是,DeepSeek不仅没发布R2,还把R1“收回”了。本报记者在DeepSeek网页端和手机端尝试转换模型,发现已经没有原来那个转换的标识,且当记者向DeepSeek询问“你是哪个模型”的时候,它的回答是“DeepSeek-V3”。DeepSeek官方对此的解释是:“当前官方网页端、App、小程序及API开放平台所调用模型均已同步更新,新模型自我认知为DeepSeek-V3。”

V3.1主要带来三个重要的变化,首先就是混合推理架构,一个模型同时支持思考模式和非思考模式,有更高的思考效率,也就是实现了R1和V3的合体。

事实上,混合推理架构已成为大模型领域的一大趋势,除DeepSeek外,此前发布的阿里通义千问Qwen3、GPT-5也都把推理模型与非推理模型进行了融合。但按照DeepSeek这次的更新逻辑,有人推测该公司或许不会继续推出R系列模型,《华夏时报》记者就此采访了DeepSeek方面,截至发稿未收到回复。

艾媒咨询创始人兼CEO张毅对《华夏时报》记者表示,混合推理架构能够在用户快速获取信息和深入分析复杂问题之间达到一些平衡,对很多用户来说可以在提升工作效率方面获得更好的体验,而且混合推理架构通过一些思维链的训练,对于降低token的消耗量、减少成本应该也有一定作用。

当然,张毅指出这种模式可能也会出现一些问题,如性能不稳定、用户需求不平衡等,但无论如何,它最起码可以解决用户遇到的一些实际问题,并考虑了算力成本,而且这个版本不会是最后的版本,未来还会不断迭代,这也是所有大模型产品必然的发展方向。

除了混合推理架构,相比5月更新的版本,V3.1能在更短时间内给出答案,且V3.1具备更强的Agent能力;且DeepSeek API同步升级后,上下文均已扩展为128K。

DeepSeek还宣布了新的价格调整方案:9月6日起,其开放平台API接口调用价格更新为输入价格0.5元/百万tokens(缓存命中)、4元/百万tokens(缓存未命中),输出价格为12元/百万tokens。这个定价算V3和R1标准价格的中和版,此前V3的输入价格为0.5元/百万tokens(缓存命中)、2元/百万tokens(缓存未命中),输出价格为8元/百万tokens,R1的输入价格为1元/百万tokens(缓存命中)、4元/百万tokens(缓存未命中),输出价格为16元/百万tokens。

但DeepSeek取消了夜间时段优惠。今年2月,DeepSeek曾推出错峰优惠活动,每日00:30至08:30的夜间空闲时段,API调用价格大幅下调,V3降至原价的50%,R1低至原来的25%。

不过,有些用户在体验过后还是更偏向于此前的R1,不少人在DeepSeek评论区呼吁恢复旧版本,还有用户催促DeepSeek赶紧上线多模态模型。

陷入大模型包围圈

与DeepSeek这不紧不慢的更新速度形成对比的,是其它国产大模型频繁的更新。

就在DeepSeek更新前一天,智谱也宣布了重磅消息。8月20日,智谱推出全球首个手机Agent,开创了Agent+云手机/云电脑的新技术范式,不抢占用户手机和电脑,还突破了硬件限制,在任何设备、任何场景下运行,帮助用户代理操作,并由国产模型(GLM-4.5、GLM-4.5V)驱动,具备推理、代码与多模态的全能能力。

在上半年获得多笔融资后,智谱下半年的模型发布更频繁了:7月先是发布了一款支持图像、视频、文档等多模态输入的通用推理型大模型GLM-4.1V-Thinking,之后又带来面向推理、代码与智能体的开源SOTA模型——GLM-4.5;8月,智谱的开源视觉推理模型GLM-4.5V正式上线并开源。

除了智谱,其它几家大模型公司也都在加快脚步。7月11日,月之暗面正式发布KimiK2模型并同步开源,Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型;7月25日,阶跃星辰推出最新的多模态推理模型Step-3;同样在7月25日,阿里发布了全新的通义千问3推理模型;8月11日,百川智能正式发布并开源医疗增强大模型Baichuan-M2。

这些国产模型,对DeepSeek形成了一个包围圈,更别说国外那些先进模型了。本月,除了OpenAI正式推出新的旗舰AI模型GPT-5,Anthropic还发布了Claude Opus 4.1,称这一模型是Opus 4在代理任务、现实世界编码和推理方面的升级版。谷歌则发布新一代世界模型Genie 3,这是谷歌第一个允许进行实时交互的世界模型。就连DeepSeek的开源策略,优势也不再明显,特斯拉CEO埃隆·马斯克本月宣布,其创办的xAI公司将开源Grok 2模型,进一步推进人工智能模型的开源策略。

在周遭竞争对手的衬托下,DeepSeek显得一点都不“卷”,对此不同业内人士有不同的看法。

“梁文锋(DeepSeek创始人)一开始就不是按照纯商业的路径去发展,他在模型上是有所追求的。”顺福资本创始人李明顺说,至于大模型的水平谁更领先,现在其实都是一种螺旋式上升的状态,你追我赶,你方唱罢我登场,没有谁能完全绝对领先。

但文渊智库创始人王超不这么认为,他指出,大模型之战即将在今年下半年收尾,过去两年多发生了翻天覆地的变化,很多企业进入这个领域,也有很多企业被淘汰,DeepSeek身在这个圈中也难以独善其身。

据AI产品榜,今年6月DeepSeek网站的访问量仍排在国内总榜第一位,但实际上已经连续4个月呈下降趋势,平均每月降低9.63%,6月访问量为3.8亿,DeepSeek应用(App)月活用户也在6月出现首次下滑,7月继续下降11.87%,其月活用户为8293万,与此同时,字节豆包、腾讯元宝两个大厂继续增长,分别达到1.32亿、4473万的月活用户。

责任编辑:于玉金 主编:寒丰

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。