蘋果公司近期在科技領域投下了一枚震撼彈,公開了一項旨在優化人形機器人學習效率的創新技術——PH2D方法。這項技術巧妙融合了人類教練的專業指導與機器人示范者的實際操作,為機器人的訓練開辟了一條既經濟又高效的全新路徑。
在一篇題為《Humanoid Policy ~ Human Policy》的研究論文中,蘋果詳細闡述了傳統訓練方法的局限性。以往,機器人示范者雖被廣泛采用,但這一過程不僅耗時費力,還需依賴價格高昂的遠程操作數據采集設備,極大地限制了訓練的普及與效率。
蘋果的新方法則通過整合人類教練與機器人示范者的數據資源,巧妙地利用了改造后的消費級硬件進行訓練素材的制作。例如,經過特別調整的Apple Vision Pro頭顯,僅需左下角攝像頭即可完成視覺捕捉任務,并結合ARKit技術,輕松獲取頭部與手部的三維姿態信息。而另一款改裝后的meta Quest頭顯,則搭載了mini ZED立體攝像頭,成為了一款經濟實惠的數據采集神器。
在訓練過程中,人類教練負責演示具體的操作動作,如抓取、抬升、倒水等,并同步進行語音講解。這些精心錄制的視頻經過降速處理后,成為了機器人學習的寶貴資料。人類教練的專業指導與實際操作演示相結合,使得機器人的學習過程更加直觀且易于理解。
蘋果還研發了一款名為“Human-humanoid Action Transformer”(簡稱HAT)的模型。這款模型能夠統一處理來自人類教練與機器人示范者的多模態數據,構建了一個通用的行為策略框架。在多項任務測試中,HAT模型展現出了比僅依靠機器人示范更強的適應能力與穩定性。特別是在執行垂直抓取等復雜任務時,其表現更是優于傳統的單一數據源訓練方式。
雖然目前蘋果僅展示了相關的機器人燈效原型,但業內已有傳聞稱,該公司正在秘密研發面向消費者市場的移動式機器人產品。這些機器人預計能夠勝任家務協助等基礎任務,為人們的生活帶來極大的便利。研究結果顯示,這種結合式的訓練方法不僅顯著降低了訓練成本,還使得機器人在實際場景中的表現力得到了質的飛躍。