
来源:Founder Park
DeepSeek 又更新了,依旧是迭代了一年的 V3 系列,但这次给出的是 V3.2 正式版。
9 月底,DeepSeek 推出了实验性模型 DeepSeek-V3.2-Exp,在 V3.1-Terminus 的基础上,引入了 DeepSeek Sparse Attention(DSA)技术,大幅提升了长文本处理的效率。
今天,发布的两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale,重点在推理、以及 Agent 能力的提升。
DeepSeek-V3.2-Speciale 作为开源模型,在 IMO 2025、CMO 2025 等主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。
有意思的是,Deepseek 在前几天刚刚发布了一个数学模型 DeepSeek-Math-V2,正是基于 DeepSeek-V3.2-Exp-Base 开发。这个数学模型实现了 IMO 金牌级的水平。
同时,这次 V3.2 正式版发布最值得一提的是,把思考过程融入到了工具调用中,模型能够同时支持思考模式和非思考模式的工具调用。在各类智能体工具调用评测集上,DeepSeek-V3.2 达到了目前开源模型的最高水平。DeepSeek 官方称,模型未针对测试集进行特殊训练,在真实场景中显示出了较强的泛化能力。
目前,正式版 DeepSeek-V3.2 已在网页端、App 和 API 上线。Speciale 版本以临时 API 形式开放。API 支持 DeepSeek-V3.2 思考模式下的工具调用能力。
海量资讯、精准解读,尽在新浪财经APP
责任编辑:杨红卜
金控配资提示:文章来自网络,不代表本站观点。