微軟研究院發布一款新的模型 Rho-alpha,為物理人工智慧,即智慧人工智慧與物理系統的結合,有望像生成模型改變語言和視覺處理一樣,重新定義機器人技術。
Rho-alpha 將自然語言指令轉換為控制訊號,用於執行雙手操作任務的機器人系統。它可被視為 VLA+ 模型,因為它擴展了感知和學習模式的範圍,超越了 VLA 通常使用的模式。
在感知方面,Rho-alpha 增加了觸覺感知,微軟正在努力使其能夠支持力覺等其他感知模式。
Rho-alpha 透過對來自物理演示和模擬任務的軌跡進行協同訓練,並結合網路規模的視覺問答數據,實現了融合視覺語言理解的觸覺感知行為。
目前該模型正在配備觸覺感測器的雙 UR5e 機械手臂系統和人形機器人上進行評估。
https://www.microsoft.com/en-us/research/story/advancing-ai-for-the-physical-world/
Picture Source
Microsoft

留言
張貼留言