DeepSeek推可自驗證數學模型DeepSeekMath-V2

2025/11/28 11:15

MoneyDJ新聞 2025-11-28 11:15:20 新聞中心發佈

綜合港媒報導，DeepSeek推出新型數學推理模型DeepSeekMath-V2，採用可自我驗證的訓練框架。該模型在2025年國際數學奧林匹克競賽(IMO 2025)和2024年中國數學奧林匹克競賽(CMO 2024)中均達到金牌水準，並在2024年普特南數學競賽(Putnam 2024)中獲得近乎滿分的118/120分優異成績。

據悉，該模型基於DeepSeek-V3.2-Exp-Base建構，通過LLM驗證器自動審查生成的數學證明，並利用高難度樣本持續優化性能，透過驗證、產生閉環和元驗證機制，顯著提升證明品質評估準確性，並實現全自動化標註。

該團隊表示，儘管尚有大量工作待推進，當前成果已表明，可自驗證的數學推理是一條切實可行的研究路徑，有望為建構更強大、更可靠的數學智慧系統奠定基礎。此外，模型代碼與權重已開源，發布於Hugging Face及GitHub平台。

個股K線圖-

回新聞列表