微軟發布物理人工智慧模型 Rho-alpha

微軟研究院發布一款新的模型 Rho-alpha，為物理人工智慧，即智慧人工智慧與物理系統的結合，有望像生成模型改變語言和視覺處理一樣，重新定義機器人技術。

Rho-alpha 將自然語言指令轉換為控制訊號，用於執行雙手操作任務的機器人系統。它可被視為 VLA+ 模型，因為它擴展了感知和學習模式的範圍，超越了 VLA 通常使用的模式。

在感知方面，Rho-alpha 增加了觸覺感知，微軟正在努力使其能夠支持力覺等其他感知模式。

Rho-alpha 透過對來自物理演示和模擬任務的軌跡進行協同訓練，並結合網路規模的視覺問答數據，實現了融合視覺語言理解的觸覺感知行為。

目前該模型正在配備觸覺感測器的雙 UR5e 機械手臂系統和人形機器人上進行評估。

Picture Source

Microsoft

KJPro Technology Blog