MoneyDJ新聞 2026-02-03 13:03:17 新聞中心 發佈
綜合港媒及陸媒報導,中國「國產大模型六小虎」之一的人工智慧(AI)初創公司智譜(2513.HK)正式發布並開源GLM-OCR。智譜表示,該模型僅0.9B參數規模,支持vLLM、SGLang和Ollama部署;在文本、公式、表格識別及訊息抽取四大細分領域的表現優於多款OCR專項模型,性能接近谷歌(Google)旗艦大模型Gemini 3 Pro。智譜股價今(3)日反彈,早盤開高走揚,午盤暫收於246.4港元、漲9.71%。
在實際應用中,GLM-OCR可精準解析掃描件、PDF、表格及票據,有效解決手寫、印章、豎排及多語言混排難題。智譜指出,GLM-OCR,以「小尺寸、高精度」實現文檔解析能力新標杆,為一款輕量的專業級OCR模型,核心亮點方面,以94.6分登頂 OmniDocBench V1.5,並在公式識別、表格識別、信息抽取的多項主流基準中均取得SOTA表現;場景優化方面,在手寫體、複雜表格、代碼文檔及印章等高難場景中表現穩健。
除此之外,推理高效,僅0.9B參數規模,支援vLLM、SGLang和Ollama部署,顯著降低推理延遲與算力開銷,適合高併發與邊緣部署;開源易用,同步開源完整SDK與推理工具鏈,環境依賴簡單,支持一行命令快速調用,輕鬆接入現有業務系統。
智譜表示,未來將持續迭代GLM-OCR,推出更多尺寸版本,並將能力延伸至更多語言和影片OCR,全面拓寬視覺智慧的應用邊界。