DeepSeek-V3.2 正式发布:开源模型也能“边想边用工具”!
这一次,不仅推理能力逼近 GPT-5 和 Gemini-3.0-Pro,更首次实现了 “思考 + 工具调用”的深度融合,让开源模型真正具备了实用级 Agent 能力。在多个权威推理评测(如 AIME、HMMT、LiveCodeBench)中,V3.2 的表现与 GPT-5 相当,仅略逊于 Gemini-3.0-Pro。在主流 Agent 评测(如 Tool-Decathlon、MCP-Mark)中

2025年12月,DeepSeek 团队正式推出 DeepSeek-V3.2 系列大模型。这一次,不仅推理能力逼近 GPT-5 和 Gemini-3.0-Pro,更首次实现了 “思考 + 工具调用”的深度融合,让开源模型真正具备了实用级 Agent 能力。

推理更强,效率更高
DeepSeek-V3.2 的目标很明确:在保持高推理能力的同时,显著降低计算开销和响应延迟。
-
在多个权威推理评测(如 AIME、HMMT、LiveCodeBench)中,V3.2 的表现与 GPT-5 相当,仅略逊于 Gemini-3.0-Pro。
-
相比 Kimi-K2-Thinking 等模型,V3.2 用 更少的输出 token 达到了相近甚至更好的准确率,大幅节省资源。
而如果你需要极限推理能力,团队还推出了 DeepSeek-V3.2-Speciale:
-
在 IMO 2025(国际数学奥林匹克)、IOI 2025(国际信息学奥林匹克)、ICPC 全球总决赛 等顶级竞赛中斩获金牌;
-
数学证明与逻辑验证能力媲美 Gemini-3.0-Pro;
-
但代价是:Token 消耗高、成本高、不支持工具调用,目前仅限研究使用。

史上首个支持“边思考边调工具”的开源模型
过去,很多模型在“深度思考模式”下无法调用外部工具(如搜索、代码执行),导致复杂任务卡壳。
DeepSeek-V3.2 打破了这一限制:
-
首次实现 思考模式下的多轮工具调用:模型可以先分析问题 → 调用工具获取信息 → 继续推理 → 再调用新工具……最终给出精准答案。
-
背后支撑的是一个 大规模 Agent 训练数据合成 pipeline:团队构建了 1800+ 虚拟环境 和 8.5 万+ 复杂指令,涵盖旅行规划、代码修复、多跳搜索等真实场景。
示例
示例:用户问“帮我规划一个三天两夜的杭州周边游,预算有限但体验要好”,模型会:
-
调用 get_all_cities() 获取周边城市;
-
查询各城市酒店、餐厅、景点价格与评分;
-
根据预算规则动态调整推荐;
-
最终输出符合所有约束的行程表。

在主流 Agent 评测(如 Tool-Decathlon、MCP-Mark)中,V3.2 大幅领先其他开源模型,甚至缩小了与闭源顶尖模型的差距。
开发者友好,即刻可用
好消息是,DeepSeek-V3.2 已全面上线:
-
官网网页端、App、API 均已升级为正式版;
-
Hugging Face 与 ModelScope 同步开放下载;
-
API 支持 思考模式 + 工具调用,文档齐全。
对于研究人员,还可临时体验 V3.2-Speciale(截至 2025-12-15):
base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"
结语
DeepSeek-V3.2 不仅是一次模型升级,更是开源社区向“实用型智能体”迈出的关键一步。它证明了:开源模型不仅能“想得深”,还能“做得对”。
未来,随着更多开发者基于 V3.2 构建应用,我们或许将迎来一个真正由开源驱动的 Agent 时代。

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐




所有评论(0)