字節跳動推新一代數學模型，推理能力效率顯著提升

2025/12/24 13:02

MoneyDJ新聞 2025-12-24 13:02:25 新聞中心發佈

綜合陸媒報導，字節跳動Seed團隊今(24)日宣布推出新一代「形式化數學推理專用模型Seed Prover 1.5」，透過大規模的Agentic RL訓練，其推理能力和推理效率宣稱取得顯著進步。

相較上一代模型，Seed Prover 1.5在16.5小時內，針對IMO 2025的前5道題目生成了完整可編譯驗證的Lean證明代碼，換算成績為35/42，達到之前IMO評分標準的金牌分數線。針對北美本科級別數學競賽Putnam，Seed Prover 1.5用時 9小時，對12道Putnam 2025賽題中的11道生成了可編譯驗證的Lean代碼。

更系統的評估中，Seed Prover 1.5在完整的Putnam歷史評估集上解決了88%的問題，在代表碩士數學難度的Fate-H和代表博士生數學難度的Fate-X評估集上，分別解決了80%和33%的問題，刷新了形式化數學推理模型在這幾個評測集上的SOTA(State Of The Art)表現。

個股K線圖-

阿里通義推新一代語音互動模型，可感知用戶情緒陸人行延續淨回籠；Shibor呈漲跌互見

回新聞列表