MoneyDJ新聞 2026-01-30 10:51:30 新聞中心 發佈
綜合陸媒報導,宇樹科技宣布開源UnifoLM-VLA-0大模型,該模型是UnifoLM系列下面向通用人形機器人操作的視覺-語言-動作(VLA)大模型,旨在突破傳統VLM在物理交互中的局限,通過在機器人操作數據上的繼續預訓練,實現了從通用「圖文理解」向具備物理常識的「具身大腦」的進化。
針對操作類任務中對指令理解與空間感知的高要求,該模型通過繼續預訓練深度融合了文本指令與2D/3D空間細節,增強了模型的空間感知能力。此外,構建了全鏈路動力學預測數據,模型具備更好的任務泛化性。在真機驗證中,僅需單一策略即可高質量完成12類複雜的操作任務。