
国产大模子风向标DeepSeek再发重磅新模子:重心强化智能体武艺,而况融入念念考和推理经过。
12月1日,DeepSeek同期发布两个郑再版模子:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale,官方网页端、App和API均已更新为郑再版 DeepSeek-V3.2,Speciale版块现在仅以临时API就业神色盛开,以供社区评测与接头。
DeepSeek-V3.2示意,其方针是均衡推理武艺与输出长度,相宜常常使用,举例问答场景和通用Agent(智能体)任务场景。在公开的推理类Benchmark测试中,DeepSeek-V3.2达到GPT-5的水平,仅略低于Gemini-3.0-Pro;比拟Kimi-K2-Thinking,V3.2的输出长度大幅镌汰,权臣减少计较支拨与用户恭候时代。
据DeepSeek方面先容,DeepSeek-V3.2-Speciale 的方针是将开源模子的推理武艺推向极致,V3.2-Speciale是DeepSeek-V3.2长念念考增强版,同期鸠合DeepSeek-Math-V2定深刻说武艺。
DeepSeek-V3.2具备辅导奴才、数学解说与逻辑考证武艺,在主流推理基准测试上的性能判辨比好意思Gemini-3.0-Pro。
不同于过往版块在念念考步地下无法调用用具的局限,DeepSeek-V3.2是首个将念念考融入用具使用的模子。同期撑合手念念考步地与非念念考步地的用具调用,现在建议一种大鸿沟Agent考验数据合成措施,DeepSeek-V3.2 模子在智能体评测中达到面前开源模子的最高水平,大幅收缩开源模子与闭源模子的差距。
值得诠释的是,V3.2并莫得针对这些测试集的用具进行稀奇考验,是以V3.2在实在诈欺场景中梗概展现出较强的泛化性。
在评测和获利方面,DeepSeek-V3.2-Speciale模子得到IMO 2025(海外数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(海外大学生神色狡计竞赛群众总决赛)及IOI 2025(海外信息学奥林匹克)金牌。其中,ICPC与IOI获利分手达到东谈主类选手第二名与第十名的水平。
值得遏制的是,DeepSeek指出,在高度复杂任务上,Speciale模子大幅优于尺度版块,但奢侈的Tokens也权臣更多,资本更高。现在,DeepSeek-V3.2-Speciale仅供接头使用,不撑合手用具调用,暂未针对常常对话与写稿任务进行专项优化。
DeepSeek是当之无愧的大模子风向标,一坐一齐王人受到行业合座关心。最近网易有谈辞书发布2025年度词汇——“deepseek”以 8672940次年度搜索量收效当选。据有谈辞书负责东谈主先容足球投注app,“deepseek”在辞书里面的搜索弧线呈现涌现的爆发式特征,从年头因“低资本”冲破算力阻塞起,确切每个紧迫进展王人会带动搜索量高潮。