重磅！DeepSeek V3.2 特别版发布：性能超越GPT-5，硬刚Gemini 3.0「IOI/IMO金牌」

IP属地中国·北京 AI寒武纪 时间：2025-12-02 00:12:08

↑阅读之前记得关注+星标⭐️，，每天才能第一时间接收到更新
DeepSeek-V3.2系列模型正式上线
作为“为Agent构建的推理优先模型”，DeepSeek-V3.2包含两个版本：
DeepSeek-V3.2：V3.2-Exp的官方继任者，平衡了推理能力与生成长度，性能对标GPT-5，现已上线App、Web端及API
DeepSeek-V3.2-Speciale：专攻深度推理能力的极限版本，性能超越GPT-5，比肩Gemini-3.0-Pro，目前仅通过API提供

技术报告显示，DeepSeek-V3.2-Speciale在2025年国际数学奥林匹克（IMO）、国际信息学奥林匹克（IOI）、ICPC世界总决赛及CMO中均取得了金牌级成绩

官方已公开上述竞赛的最终提交结果，社区可通过assets/olympiad_cases进行二次验证

技术报告：
https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf

以下是详细信息
核心能力与技术突破
DeepSeek-V3.2基于三大技术突破，实现了高计算效率与卓越推理、Agent性能的统一：
1.DeepSeek Sparse Attention (DSA)：引入高效注意力机制，大幅降低计算复杂度，并针对长上下文场景进行了优化
2.可扩展强化学习框架：通过稳健的RL协议与后训练（post-training）算力扩展，实现了高性能表现
3.大规模Agent任务合成管线：涵盖1800+环境及8.5万+复杂指令
这一合成管线不仅提升了模型在复杂交互环境中的遵循度和泛化能力，更让DeepSeek-V3.2将“思考”直接整合进工具使用（Tool-Use）的模型，同时支持在思考和非思考模式下使用工具

API更新与Speciale版限制
DeepSeek-V3.2：
API使用模式与V3.2-Exp保持一致，作为日常主力模型（Daily Driver），提供GPT-5级别的性能
DeepSeek-V3.2-Speciale：
该版本专为解决复杂任务设计，消耗更多Token，目前仅作为API提供，具体限制如下：
临时端点：需使用
base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"
服务期限：该端点服务至2025年12月15日 15:59 (UTC) 截止
功能限制：不支持工具调用（Tool Calls），仅用于支持社区评估与研究。
定价：与DeepSeek-V3.2保持一致
聊天模板重大调整
DeepSeek-V3.2不再提供Jinja格式模板，并引入了“带工具思考”及新角色设定。
Python脚本编码：官方提供了encoding文件夹，包含Python脚本（encoding_dsv32.py），用于将OpenAI兼容格式消息编码为模型输入字符串及解析输出
Developer角色：模板新增developer角色，专门用于搜索Agent场景，官方API不接受分配给该角色的消息
输出解析注意：提供的解析函数仅处理格式良好的字符串，生产环境需自行增加稳健的错误处理机制。
代码示例如下：
import transformers
from encoding_dsv32 import encode_messages

tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
# 思考模式配置
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)本地部署建议
模型结构与DeepSeek-V3.2-Exp相同。
采样参数：建议设置 temperature = 1.0，top_p = 0.95。
Speciale版提示：本地部署Speciale版本时，同样不支持工具调用功能
开源与协议
仓库及模型权重均采用 MIT License 授权。
--end--
最后记得⭐️我，这对我非常重要，每天都在更新：
欢迎点赞转发推荐评论，别忘了关注我

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

新春走基层| 这个春节，近万个充电桩从容出海巴西

碳化硅迎产业化风口？工艺改进与成本控制仍面临“持久战”

上海机器人“进厂打工”，专挑高强度产线和工人比劳动效率，替人日行5万步

太空3D打印金属构件成为现实（我身边的最强大脑）

把太阳能电站“搬上天”（国际科技前沿）

“瓦特”这样变“比特”（深度观察）

全站最新

新春走基层| 这个春节，近万个充电桩从容出海巴西

碳化硅迎产业化风口？工艺改进与成本控制仍面临“持久战”

上海机器人“进厂打工”，专挑高强度产线和工人比劳动效率，替人日行5万步

太空3D打印金属构件成为现实（我身边的最强大脑）

热门推荐

新春走基层| 这个春节，近万个充电桩从容出海巴西

中国生物制药(01177)自主研发的国家1类创新药罗伐昔替尼片获批上市

加速技术迭代，筑牢安全底线，中国首个“人形机器人标准体系”出炉

从“幽灵GDP”看AI：长期红利与短期阵痛

碳化硅迎产业化风口？工艺改进与成本控制仍面临“持久战”

上海机器人“进厂打工”，专挑高强度产线和工人比劳动效率，替人日行5万步

沃尔玛首席人力资源官：美国员工应向中国取经

乔骁：无护栏的AI“狂欢”威胁美国经济

太空3D打印金属构件成为现实（我身边的最强大脑）

给分子拍部“高清电影”（科技大观）

把太阳能电站“搬上天”（国际科技前沿）

像章鱼一样“变装”的仿生材料（创新汇）

“瓦特”这样变“比特”（深度观察）

国泰海通：SpaceX计划在月球电磁弹射卫星推动国内火箭技术加速迭代

【钛晨报】中国首个国家级人形机器人与具身智能标准体系发布；英伟达计划推出新芯片以加速人工智能处理；主要产油国宣布4月增产