DeepSeek發布V3.2系列模型,推理能力直逼GPT-5

2025/12/02 09:05

MoneyDJ新聞 2025-12-02 09:05:22 新聞中心 發佈

綜合港媒及陸媒報導,DeepSeek宣布同時推出兩個正式版人工智慧(AI)模型,包括DeepSeek-V3.2和DeepSeek-V3.2-Speciale。V3.2在工具呼叫能力上達到目前開源模型最高水準,大幅縮小開源模型與閉源模型的差距。

在推理能力方面,V3.2在數學基準(AIME 2025)測試中達到93.1%的通過率,接近GPT-5的94.6%和Gemini-3.0-Pro的95%。而Gemini-3.0-Pro在今(2025)年國際數學奧林匹克競賽(IMO 2025)等四項國際頂級競賽中斬獲金牌。

據DeepSeek指出,DeepSeek-V3.2的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用Agent(智慧體)任務場景;在公開的推理類Benchmark測試中,DeepSeek-V3.2達到GPT-5的水準,僅略低於Gemini-3.0-Pro;相較Kimi-K2-Thinking,V3.2的輸出長度大幅降低,顯著減少計算開銷與用戶等待時間。

V3.2-Speciale的目標是將開源模型的推理能力推向極致,是DeepSeek-V3.2長思考增強版,同時結合DeepSeek-Math-V2定理證明能力,探索模型能力的邊界。

不同於過往版本在思考模式下無法調用工具的局限,DeepSeek-V3.2是首個將思考融入工具使用的模型。同時支援思考模式與非思考模式的工具調用,目前提出一種大規模Agent訓練資料合成方法,DeepSeek-V3.2 模型在智慧體評測中達到當前開源模型的最高水準,大幅縮小開源模型與閉源模型的差距。值得說明的是,V3.2並沒有針對這些測試集的工具進行特殊訓練,所以V3.2在真實應用場景中能夠展現出較強的泛化性。

個股K線圖-
熱門推薦