宇樹科技開源VLA大模型助力通用人形機器人操作

2026/01/30 10:51

MoneyDJ新聞 2026-01-30 10:51:30 新聞中心發佈

綜合陸媒報導，宇樹科技宣布開源UnifoLM-VLA-0大模型，該模型是UnifoLM系列下面向通用人形機器人操作的視覺-語言-動作(VLA)大模型，旨在突破傳統VLM在物理交互中的局限，通過在機器人操作數據上的繼續預訓練，實現了從通用「圖文理解」向具備物理常識的「具身大腦」的進化。

針對操作類任務中對指令理解與空間感知的高要求，該模型通過繼續預訓練深度融合了文本指令與2D/3D空間細節，增強了模型的空間感知能力。此外，構建了全鏈路動力學預測數據，模型具備更好的任務泛化性。在真機驗證中，僅需單一策略即可高質量完成12類複雜的操作任務。