DeepSeek开源新基础模型，但不是V4，而是V3.1-Base

IP属地中国·北京 编辑：赵静机器之心 时间：2025-08-20 10:11:45

昨晚，深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1，上下文长度拓展至 128k」并更新了 UI （去掉了 DeepThink 旁的 R1 标示）之后，在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。
模型地址：https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
从名字也能看出来，该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1，而不是像之前以前命名为 V3 带四位日期数字的形式（如 V3-0324），尽管社区有诸多猜测，但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样，这一次同样是模型先行，说明和宣传还在后面。
该模型一发布就吸引了 AI 社区的广泛关注，短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位！
具体技术指标上，DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大，同样的参数量，采用了混合专家（MoE）架构，拥有 128k 上下文长度。
整体来看，社交网络上对深度求索的这次更新看法不一。有人表示非常振奋，认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫，但也有人认为这次更新不够亮眼，没有达到该公司之前的一贯水准。
对此，你怎么看？

标签：模型 deepseek 上下文 深度长度 v4 新基础

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

AI产品开箱即用腾讯智能体集中亮相WAIC

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

字节两员离职大将，单挑老东家？

阿维塔07L开启预售：全系标配华为ADS 5与896线激光雷达，24.99万元起

全站最新

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

AI产品开箱即用腾讯智能体集中亮相WAIC

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

热门推荐

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

AI产品开箱即用腾讯智能体集中亮相WAIC

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

英矽智能创始人：中国让人工智能惠及全球更多国家

字节两员离职大将，单挑老东家？

阿维塔07L开启预售：全系标配华为ADS 5与896线激光雷达，24.99万元起

对话|大晓机器人董事长王晓刚：商业化落地路径采取先To B后To C

大盘回撤银行股逆势抗跌，分红创新高后行情延续性几何？

紫银转债迎最后交易日，未转股比例高达99.99%，青农转债接棒大考

飞天茅台i茅台零售价涨至1639元/瓶，1L规格同步上调

安克充电宝首批获新国标认证，26年全线新品同步跟进

磐石·科学基础大模型2.0发布——通专“双轮驱动”，探索科研新范式

中国工程院院士、阿里云创始人王坚：AI的下一场革命，关键在“科学数据”

金融城小燃哥｜AI 支付要来了，你准备好了吗？