DeepSeek推OCR 2模型,視覺邏輯理解更接近人類

2026/01/28 11:10

MoneyDJ新聞 2026-01-28 11:10:54 新聞中心 發佈

綜合陸媒及港媒報導,DeepSeek昨(27)日發布新一代光學字符識別模型DeepSeek-OCR 2,該模型採用創新的DeepEncoder V2架構,使AI能夠像人類一樣按照邏輯順序「看」圖像。此一進展可能重塑文檔處理、圖表分析等依賴複雜視覺理解的應用場景。

據悉,這項技術的核心創新在於改變了傳統AI處理圖像的方式。DeepEncoder V2讓AI基於圖像含義動態重新排列圖像片段,而非傳統的從左到右剛性掃描。這種方法模仿了人類追隨場景邏輯流的方式。

根據DeepSeek公布的技術報告,DeepSeek-OCR 2在多項關鍵指標上展現出顯著優勢。在OmniDocBench v1.5基準測試中,該模型取得了91.09%的成績,較前代提升了3.73%,特別是在讀取順序識別方面表現出了更強的邏輯性。

個股K線圖-
熱門推薦