智譜推原生多模態Coding基座模型深度融合視覺/編程

2026/04/02 11:19

MoneyDJ新聞 2026-04-02 11:19:31 新聞中心發佈

綜合陸媒及港媒報導，中國AI新創企業智譜(2513.HK)今(2)日發布首個原生多模態Coding基座模型GLM-5V-Turbo。該模型最大突破在於深度融合視覺與編程能力，能夠原生處理文本、圖片、影片等多模態信息，同時擅長編程、長程規劃、操作執行等複雜任務。GLM-5V-Turbo在多模態Coding、Agent等核心基準上取得領先表現，引入視覺能力的同時，純文本編程與推理能力保持了同等水準，並已通過智譜MaaS平台開放接入。

據悉，GLM-5V-Turbo從預訓練階段深度融合視覺與文本能力，讓編程不再局限於純文本輸入，模型能看懂設計稿、截圖、網頁介面，並據此生成完整可運行的代碼，真正做到看得懂畫面、寫得出代碼。模態支持多模態工具調用，上下文窗口擴展至200k，並在多模態Coding、Tool Use、GUI Agent等核心基準上取得領先表現。

此外，能深度適配Claude Code與龍蝦場景，與Claude Code、OpenClaw/AutoClaw等Agent深度協同，支持「看懂環境、規劃動作、執行任務」的完整閉環，並提供全套官方Skills，開箱即用。在AutoClaw等龍蝦Agent中接入GLM-5V-Turbo後，龍蝦具備了真正的視覺能力，能看懂螢幕上的信息。模型在衡量龍蝦Agent任務執行質量的PinchBench、ClawEval和ZClawBench上取得優異成績，驗證了其在複雜任務執行場景中的綜合能力。

個股K線圖-

人型機器人商用加速，花旗上調優必選目標價陸安卓廠牌傳本月漲價，新/舊機種均上調

回新聞列表

智譜推原生多模態Coding基座模型 深度融合視覺/編程

智譜推原生多模態Coding基座模型深度融合視覺/編程