DeepSeek-V3.2 正式发布：开源模型也能“边想边用工具”！

这一次，不仅推理能力逼近 GPT-5 和 Gemini-3.0-Pro，更首次实现了 “思考 + 工具调用”的深度融合，让开源模型真正具备了实用级 Agent 能力。在多个权威推理评测（如 AIME、HMMT、LiveCodeBench）中，V3.2 的表现与 GPT-5 相当，仅略逊于 Gemini-3.0-Pro。在主流 Agent 评测（如 Tool-Decathlon、MCP-Mark）中

中科创新烁智

645人浏览 · 2025-12-02 22:36:30

中科创新烁智 · 2025-12-02 22:36:30 发布

2025年12月，DeepSeek 团队正式推出 DeepSeek-V3.2 系列大模型。这一次，不仅推理能力逼近 GPT-5 和 Gemini-3.0-Pro，更首次实现了 “思考 + 工具调用”的深度融合，让开源模型真正具备了实用级 Agent 能力。

推理更强，效率更高

DeepSeek-V3.2 的目标很明确：在保持高推理能力的同时，显著降低计算开销和响应延迟。

在多个权威推理评测（如 AIME、HMMT、LiveCodeBench）中，V3.2 的表现与 GPT-5 相当，仅略逊于 Gemini-3.0-Pro。
相比 Kimi-K2-Thinking 等模型，V3.2 用更少的输出 token 达到了相近甚至更好的准确率，大幅节省资源。

而如果你需要极限推理能力，团队还推出了 DeepSeek-V3.2-Speciale：

在 IMO 2025（国际数学奥林匹克）、IOI 2025（国际信息学奥林匹克）、ICPC 全球总决赛等顶级竞赛中斩获金牌；
数学证明与逻辑验证能力媲美 Gemini-3.0-Pro；
但代价是：Token 消耗高、成本高、不支持工具调用，目前仅限研究使用。

史上首个支持“边思考边调工具”的开源模型

过去，很多模型在“深度思考模式”下无法调用外部工具（如搜索、代码执行），导致复杂任务卡壳。

DeepSeek-V3.2 打破了这一限制：

首次实现思考模式下的多轮工具调用：模型可以先分析问题 → 调用工具获取信息 → 继续推理 → 再调用新工具……最终给出精准答案。
背后支撑的是一个大规模 Agent 训练数据合成 pipeline：团队构建了 1800+ 虚拟环境和 8.5 万+ 复杂指令，涵盖旅行规划、代码修复、多跳搜索等真实场景。

示例

示例：用户问“帮我规划一个三天两夜的杭州周边游，预算有限但体验要好”，模型会：

调用 get_all_cities() 获取周边城市；
查询各城市酒店、餐厅、景点价格与评分；
根据预算规则动态调整推荐；
最终输出符合所有约束的行程表。

在主流 Agent 评测（如 Tool-Decathlon、MCP-Mark）中，V3.2 大幅领先其他开源模型，甚至缩小了与闭源顶尖模型的差距。

开发者友好，即刻可用

好消息是，DeepSeek-V3.2 已全面上线：

官网网页端、App、API 均已升级为正式版；
Hugging Face 与 ModelScope 同步开放下载；
API 支持思考模式 + 工具调用，文档齐全。

对于研究人员，还可临时体验 V3.2-Speciale（截至 2025-12-15）：

base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"

结语

DeepSeek-V3.2 不仅是一次模型升级，更是开源社区向“实用型智能体”迈出的关键一步。它证明了：开源模型不仅能“想得深”，还能“做得对”。

未来，随着更多开发者基于 V3.2 构建应用，我们或许将迎来一个真正由开源驱动的 Agent 时代。

火山引擎开发者社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Dify 知识库构建实战指南

火山引擎开发者社区

【AI应用】Tbox神仙用法，一句话描述创作效果还不错的应用，随机菜单生成开发，一起来看看是如何通过多智能体协同开发

火山引擎开发者社区

深度残差网络ResNet结构

火山引擎开发者社区

所有评论(0)

查看更多评论

中科创新烁智

@qq_36396104

已为社区贡献11条内容