日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

百度PARL再度夺冠NeurIPS仿生人挑战赛:强化学习控制的流畅行走

發布時間:2024/10/8 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 百度PARL再度夺冠NeurIPS仿生人挑战赛:强化学习控制的流畅行走 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在最近的 NeurlPS 2019 強化學習賽事中,百度憑借基于飛槳的自研強化學習框架 「PARL」 再次奪冠。


機器學習領域頂級會議 NeurIPS 2019 將于 12 月 8 日-14 日在加拿大溫哥華開幕。不久之前,大會公布了論文評審結果,今年大會共收到 6743 份有效論文,接收了?1428 篇,錄取率為?21.17%。
作為國內最早投身 AI 領域的科技巨頭,百度今年有多篇論文入選。
此外,會議主辦的 NeurIPS 2019: Learn to Move 強化學習賽事落下帷幕,百度繼?后再度蟬聯冠軍。本次比賽的難度非常大,在參賽的近 300 支隊伍中,僅有 3 支隊伍完成了最后挑戰。百度基于飛槳的強化學習框架 PARL 不僅成功完成挑戰,還大幅領先第二名 143 分。顯而易見,百度在強化學習領域占據了明顯的優勢,冠軍含金量頗高。

強化學習框架 PARL:https://github.com/PaddlePaddle/PARL


近年,隨著機械設計以及動力學控制技術的發展,仿生機器人正取得不斷的進步。比如近來波士頓動力(Boston Dynamics)發布的機器人會跑步,會拉貨車,甚至還會“反擊”人類,而控制這些機器人的主要節點是動力學關節。

相比于鋼鐵造就、機械控制的機器人,人體的復雜程度有過之而無不及。探索和理解人體自身是人類的終極目標之一。人體內有 206 塊骨骼、639 塊肌肉,正是對這些骨骼和肌肉的精細控制,造就了人類出色靈活的運動能力和平衡保持能力。近年來有很多研究希望了解人體的運動機制,甚至端到端地從肌肉層面直接學習控制仿生人體。針對人體控制這樣復雜的場景,強化學習(Reinforcement Learning)是重要的研究手段。

強化學習是機器學習的范式和方法論之一,用于描述和解決智能體(agent)在與環境的交互過程中,通過學習策略以達成回報最大化或實現特定目標的問題。但直接使用強化學習,仍然非常困難。其中一個原因在于,人體控制的解空間實在太大了!高達兩百多維度的連續狀態空間,非常復雜,一般的強化學習算法完全無法奏效。正因為如此,誕生了很多以控制人體為目標的研究和比賽,吸引著各路高手一決雌雄。

NeurIPS: Learn to Move 強化學習賽事的誕生正意在于此。該賽事由斯坦福仿生動力學實驗室舉辦,比賽采用斯坦福國家醫學康復研究中心研發的 Opensim 人體骨骼高仿模型。參賽者需要根據該模型中多達 100 多維以上的狀態描述特征,來決定模型肌肉的信號,控制模型的肌體行走。

該挑戰賽創辦于 2017 年,今年是第三年舉辦。2017 年第一次挑戰賽上,比賽規則圍繞誰能讓模型肌體行走速度最快,2018 年賽事將整個模型運動控制從 2D 改為 3D 外,還引入帶有假肢的模型,而今年比賽難度再次提升。
據悉,賽事分為 2 輪,首輪主要是增加了實時的速度變換要求,而真正的挑戰集中在第 2 輪,參賽選手僅有短短2周時間來完成任務。這一輪不僅要求實時切換速度,而且是 360° 范圍調整行走方向,更增加了模型控制難度。由于實際狀態空間和動作空間稠密并且非常大,導致基于強化學習的算法無法準確把握模型肌體的行走姿勢。
盡管每年的賽事難度都在增加,但今年的百度仍取得了優異成績。據了解,在百度的最優解決方案中,甚至出現了一些普通人也難以做到的動作,如從立定狀態突然平順地向后轉向并且同時以要求的速度行走,而且這個過程需要全程保持穩定不會摔倒。


百度能夠在此次賽事中取得優異表現、蟬聯冠軍的主要因素是在于訓練機制、通用算法庫、迭代效率三個方面長足的技術積累。

首先,百度構建了「課程學習」的訓練機制,先從高速奔跑中學習姿態,再逐步降速提升行走穩定性,從而學到了一個和人類極為相似的行走姿態。根據歷屆參賽選手提供的行走視頻來看,百度通過這種方法學習出來的行走姿勢是最為自然的,接近真實人類行走姿勢的。這個行走姿勢不僅可以維持人體的平衡性,還可以靈活地應付各種速度大小、角度的變化。


其次,百度采用了自主研發的強化學習框架? PARL。通過復用通用算法庫里面已經實現好的算法,參賽選手得以很快地在不同算法間切換,保持了高效的迭代頻率。PARL 的算法庫涵蓋了經典的連續控制算法 Reinforce,以及主流的 DDPG/PPO 等算法,到最前沿的 model-based 等相關算法。盡管算法庫包含了各種類型的復雜算法,但是其接口是相當簡單的,基本上是 import 即可用的方式。

最后,百度基于PARL提供的高效靈活的并行化訓練能力進行強化學習訓練,使得訓練效率得以數百倍地提升。PARL 的并行接口的設計思想是用 python 的多線程代碼實現真正意義上的高并發,參賽選手只需要寫多線程級別的代碼,然后加上PARL的并行修飾符就可以調度不同機器的計算資源,達到高并發的性能。
而此次獲得冠軍的百度「PARL」,名字來源于 PaddlePaddle Reinforcement Learning,是基于百度飛槳(PaddlePaddle)研發的靈活高效的強化學習框架。PARL 應用了百度多年來在強化學習領域的技術深耕和產品應用經驗,具有更高的可擴展性、可復現性和可復用性,強大的大規模并行化支持能力。開發者可以通過 PARL 用數行代碼定制自己的模型,一個修飾符就能實現并行。此外,PARL 代碼風格統一,包含了多個入門級別的強化學習算法,對初學者相當友好。
事實上百度對強化學習的關注始于 2012 年,當時的百度就已經將多臂老虎機 (Multi-armed bandit) 的研究結果應用在百度搜索和推薦等產品和功能上,此后,強化學習相繼落地在了度秘、鳳巢、新聞 Feed 推薦以及越來越多的相關產品中。
今年 1 月,百度正式發布了深度強化學習框架 PARL,更強勁的強化學習能力也正在通過飛槳平臺賦能給更多開發者。

🔍

現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧

關于PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。

▽ 點擊 |?閱讀原文?|?訪問項目主頁

總結

以上是生活随笔為你收集整理的百度PARL再度夺冠NeurIPS仿生人挑战赛:强化学习控制的流畅行走的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产一级理论 | 特级丰满少妇一级aaa爱毛片 | 中文字幕在线观看欧美 | 日本在线高清视频 | 激情亚洲网 | 男女午夜视频在线观看 | 日本综合在线 | 毛片在线不卡 | 97视频| 宅男av | 国产对白刺激视频 | 久久911| 国产成人短视频在线观看 | 伊人激情影院 | 国产精品视频在线播放 | 97国产精东麻豆人妻电影 | 欧美极品少妇无套实战 | jizz在线免费观看 | 中文字幕观看av | 福利国产片 | 欧美日韩免费 | 亚洲 欧美 成人 | 五月婷婷综合激情网 | 国产麻豆剧传媒精品国产 | 性生交大片免费看狂欲 | 欧美三区视频 | 国产v在线观看 | 97久草| 91蝌蚪网| av网址导航 | 插插插av | 黄色片网站在线播放 | 伊人激情综合 | 欧美粉嫩videosex极品 | 日韩一区二区三区在线视频 | 五月天色视频 | 国产专区在线 | 午夜888| 91碰碰| 亚洲三区在线 | 麻豆国产精品 | jvid乐乐 | 综合久久精品 | 激情瑟瑟| 在线免费观看av网址 | 免费午夜视频 | 黄色av免费在线看 | 亚洲黄色片子 | aaa色| 男人天堂a在线 | 国产理论片 | 久久噜 | 国产中文字幕一区二区三区 | 婷婷成人av | 欧美888| 日本熟女毛茸茸 | 黄色大片儿. | 国产有码在线观看 | 欧美日韩国产一区二区三区 | 精品国产一区二区三区性色 | 91成人毛片 | 黄a大片 | wwwxxxx日本| 日韩免费精品 | 欧美日韩激情网 | 欧美极品aaaaabbbbb | 免费成年人视频在线观看 | 五月婷婷久久综合 | 深夜免费福利 | 欧美视频一区在线观看 | 一本av在线| 亚洲视频在线观看免费 | 伊人青青草 | 天堂网av在线 | 成人在线直播 | 天天看av | 日本人三级 | 体内射精一区二区 | 国产丰满果冻videossex | 国精品无码人妻一区二区三区 | 欧美色偷偷 | 久久精国产 | 日韩脚交footjobhd | 女同互舔视频 | 精品中文字幕在线 | 黄色在线观看免费视频 | 91蜜桃视频| 一级黄色片免费播放 | 老司机久久精品视频 | www夜片内射视频日韩精品成人 | 天天综合天天 | 国产夜色精品一区二区av | 国产盗摄视频在线观看 | 激情国产在线 | 免费看黄色一级大片 | 国产精品天天av精麻传媒 | 蜜桃臀一区二区三区 | 成人性生交视频免费观看 | 国产在线资源 |