MoneyDJ新聞 2026-04-02 11:19:31 新聞中心 發佈
綜合陸媒及港媒報導,中國AI新創企業智譜(2513.HK)今(2)日發布首個原生多模態Coding基座模型GLM-5V-Turbo。該模型最大突破在於深度融合視覺與編程能力,能夠原生處理文本、圖片、影片等多模態信息,同時擅長編程、長程規劃、操作執行等複雜任務。GLM-5V-Turbo在多模態Coding、Agent等核心基準上取得領先表現,引入視覺能力的同時,純文本編程與推理能力保持了同等水準,並已通過智譜MaaS平台開放接入。
據悉,GLM-5V-Turbo從預訓練階段深度融合視覺與文本能力,讓編程不再局限於純文本輸入,模型能看懂設計稿、截圖、網頁介面,並據此生成完整可運行的代碼,真正做到看得懂畫面、寫得出代碼。模態支持多模態工具調用,上下文窗口擴展至200k,並在多模態Coding、Tool Use、GUI Agent等核心基準上取得領先表現。
此外,能深度適配Claude Code與龍蝦場景,與Claude Code、OpenClaw/AutoClaw等Agent深度協同,支持「看懂環境、規劃動作、執行任務」的完整閉環,並提供全套官方Skills,開箱即用。在AutoClaw等龍蝦Agent中接入GLM-5V-Turbo後,龍蝦具備了真正的視覺能力,能看懂螢幕上的信息。模型在衡量龍蝦Agent任務執行質量的PinchBench、ClawEval和ZClawBench上取得優異成績,驗證了其在複雜任務執行場景中的綜合能力。