会自学的四足机器人,3.5个小时学会走路!
近日,Google的最新研究可能會使這種學習過程變得更加簡單。
谷歌,加州大學伯克利分校和佐治亞理工學院的研究人員聯合發表了一篇論文,構建了一個通過AI自學走路的四足機器人,并將它取名為“RainbowDash”。
RainbowDash只需要幾個小時就可以完全獨立的向前走和向后走,以及左右轉彎。
研究人員在學習如何在三種不同地形上行走的任務上測試了這個系統:
平坦的地面,柔軟的床墊和帶有縫隙的門墊。
根據論文中的測試數據顯示,RainbowDash在堅硬平坦的地面上學習走路需要1.5個小時,在由記憶海綿材質的床墊上大約需要5.5個小時,在鏤空的地毯上大約需要4.5個小時。
總結起來:RainbowDash平均只需要大約3.5小時來學習向前、向后和左右轉彎等運動。
而根據世界紀錄,嬰兒從爬行到學會行走的最快速度是6個月。
具體來說,RainbowDash結合了深度學習和強化學習兩種不同類型的AI技術。通過深度學習,系統可以處理和評估來自其身處環境的原始輸入數據;通過強化學習,算法可以反復試驗,以學習如何執行任務,并根據完成的程度來獲得獎勵和懲罰。
也就是說,通過上述的這種方式,機器人便可以在其不了解環境中實現自動控制策略。
在以往的此類實驗中,研究人員最初都會讓機器人通過模擬來學習真實世界的環境。在仿真環境中,機器人的虛擬體首先與虛擬環境進行交互,然后,算法接收這些虛擬數據,直到系統有能力應對這些數據,一個搭載系統的物理形態的機器人才會被放置到現實環境中進行實驗。
這種方法有助于避免在試錯過程中對機器人及其周圍環境造成損害。
不過,環境雖然容易建模,但通常耗時長,而且現實環境中充滿了各種意想不到的情況,因此,在模擬環境中訓練機器人的意義有限。畢竟,此類研究的最終目標恰恰是讓機器人為現實世界的場景做好準備。
Google和佐治亞理工學院以及加州大學伯克利分校的研究人員則在一開始就在真實環境中對Rainbow Dash進行訓練,這樣一來,機器人不僅能夠很好地適應自己所處的環境,也能夠更好地適應相似的環境。
盡管研究團隊將RainbowDash的學習能力歸功于它自己,但人為干預仍在實現該目標方面發揮了重要作用。
例如研究人員必須創建邊界,機器人可以在該邊界內學習走路,以防止機器人離開該區域。他們還必須設計特定的算法來防止機器人摔倒,其中一些算法集中在限制機器人的運動上。
為了防止諸如墜落損壞之類的事故,通常在數字環境中進行機器人強化學習,然后再將算法轉移到物理機器人上以保持其安全性。
據悉,研究人員希望他們的算法能適用于不同種類的機器人,或適用于多個機器人在同一環境中同時進行學習。研究人員相信,破解機器人的運動能力將是解鎖更多實用機器人的關鍵。
最后放上論文下載地址:https://arxiv.org/pdf/2002.08550.pdf
-END-
猜你喜歡
真人出鏡,微信視頻號第一期視頻來了!<<戳這里
機器人是如何群居生活的?<<戳這里
帶你深入淺出學STM32。<<戳這里
?最 后??
?若覺得文章不錯,轉發分享,也是我們繼續更新的動力。
5T資源大放送!包括但不限于:C/C++,Linux,Python,Java,PHP,人工智能,PCB、FPGA、DSP、labview、單片機、等等!
在公眾號內回復「更多資源」,即可免費獲取,期待你的關注~
長按識別圖中二維碼關注
總結
以上是生活随笔為你收集整理的会自学的四足机器人,3.5个小时学会走路!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 保时捷2022年财报出炉:营收376亿欧
- 下一篇: 苹果MR产品年内发布?核心零部件供应商提