DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

IP属地中国·北京 编辑：柳晴雪星海情报局 时间：2025-08-21 18:39:04

今天，我们正式发布DeepSeek-V3.1。本次升级包含以下主要变化：

混合推理架构：一个模型同时支持思考模式与非思考模式；
更高的思考效率：相比 DeepSeek-R1-0528，DeepSeek-V3.1-Think 能在更短时间内给出答案；
更强的 Agent 能力：通过 Post-Training 优化，新模型在工具使用与智能体任务中的表现有较大提升。

官方 App 与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮，实现思考模式与非思考模式的自由切换。
DeepSeek API 也已同步升级，deepseek-chat对应非思考模式，deepseek-reasoner对应思考模式，且上下文均已扩展为 128K。同时，API Beta 接口支持了strict模式的 Function Calling，以确保输出的 Function 满足 schema 定义。（详见官方文档：https://api-docs.deepseek.com/zh-cn/guides/function_calling）
另外，我们增加了对Anthropic API格式的支持，让大家可以轻松将 DeepSeek-V3.1 的能力接入Claude Code框架。（详见官方文档：https://api-docs.deepseek.com/zh-cn/guides/anthropic_api）

工具调用/智能体支持增强
编程智能体

表 1：编程智能体测评（SWE 使用内部框架测评，相比开源框架 OpenHands 所需轮数更少；Terminal Bench 使用官方 Terminus 1 framework）
在代码修复测评 SWE 与命令行终端环境下的复杂任务（Terminal-Bench）测试中，DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。
搜索智能体

表 2：搜索智能体测评（测试结果调用商用搜索引擎 API+网页过滤+128K context window；R1-0528 使用内部 workflow 模式测试；HLE 测试同时使用 python 与 search 工具）
DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试（browsecomp）与多学科专家级难题测试（HLE）上，DeepSeek-V3.1 性能已大幅领先 R1-0528。
思考效率提升
我们的测试结果显示，经过思维链压缩训练后，V3.1-Think 在输出 token 数减少 20%-50% 的情况下，各项任务的平均表现与 R1-0528 持平。

在各项评测指标得分基本持平的情况下（AIME 2025: 87.5/88.4， GPQA: 81/80.1， liveCodeBench: 73.3/74.8），R1-0528 与 V3.1-Think 的 token 消耗量对比图
同时，V3.1 在非思考模式下的输出长度也得到了有效控制，相比于 DeepSeek-V3-0324 ，能够在输出长度明显减少的情况下保持相同的模型性能。
API & 模型开源

模型开源
V3.1的 Base 模型在 V3 的基础上重新做了外扩训练，一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。
Base 模型：
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭：
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后训练模型：
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
魔搭：
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
需要注意的是，DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。另外，V3.1 对分词器及 chat template 进行了较大调整，与 DeepSeek-V3 存在明显差异。建议有部署需求的用户仔细阅读新版说明文档。
价格调整
我们将于北京时间 2025 年 9 月 6 日凌晨起，对 DeepSeek 开放平台 API 接口调用价格进行如下调整：

执行新版价格表（如下图所示，详见定价页面）；
取消。

在 9 月 6 日前，所有 API 服务仍按原价格政策计费，您可继续享受当前优惠。
同时，为更好地满足用户的调用需求，我们已进一步扩容 API 服务资源，欢迎使用！

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

话人工智能｜大模型收费，合理吗？

实测微信AI，15年前的预言如今实现了吗？

京东与魔法原子达成战略合作共拓具身智能产业化新范式

达沃斯里的“浙江声音”：不做旁观者，深度拥抱AI新浪潮

周鸿祎谈三六零押注AI：传统软件将沦为智能体工具

马云的泥巴，阿里的算盘

全站最新

话人工智能｜大模型收费，合理吗？

实测微信AI，15年前的预言如今实现了吗？

京东与魔法原子达成战略合作共拓具身智能产业化新范式

达沃斯里的“浙江声音”：不做旁观者，深度拥抱AI新浪潮

热门推荐

广州银行定增“闯关时刻”：证监会发出“三问”，支行卷入欺诈发行追偿案

英伟达放弃PC游戏玩家的真正原因

豆包官宣推出专业版，国产模型正跨越生产力“质变点”

618大促观察：回归理性，重塑格局

从580亿到万亿市值，智谱的半年狂奔

硬科技VC，倒闭了

互联网商业模式之死

顺丰的“东方叙事”快要讲完了

七匹狼再赴佛罗伦萨，以东方美学深度对话全球时尚

车建新押注爱琴海，再干30年

99万元的全球首款实体瘤CAR-T疗法，仍陷天价可及性困局

话人工智能｜大模型收费，合理吗？

实测微信AI，15年前的预言如今实现了吗？

京东与魔法原子达成战略合作共拓具身智能产业化新范式

达沃斯里的“浙江声音”：不做旁观者，深度拥抱AI新浪潮