DeepSeek推可自驗證數學模型DeepSeekMath-V2

2025/11/28 11:15

MoneyDJ新聞 2025-11-28 11:15:20 新聞中心 發佈

綜合港媒報導,DeepSeek推出新型數學推理模型DeepSeekMath-V2,採用可自我驗證的訓練框架。該模型在2025年國際數學奧林匹克競賽(IMO 2025)和2024年中國數學奧林匹克競賽(CMO 2024)中均達到金牌水準,並在2024年普特南數學競賽(Putnam 2024)中獲得近乎滿分的118/120分優異成績。

據悉,該模型基於DeepSeek-V3.2-Exp-Base建構,通過LLM驗證器自動審查生成的數學證明,並利用高難度樣本持續優化性能,透過驗證、產生閉環和元驗證機制,顯著提升證明品質評估準確性,並實現全自動化標註。

該團隊表示,儘管尚有大量工作待推進,當前成果已表明,可自驗證的數學推理是一條切實可行的研究路徑,有望為建構更強大、更可靠的數學智慧系統奠定基礎。此外,模型代碼與權重已開源,發布於Hugging Face及GitHub平台。

個股K線圖-
熱門推薦