《Easy RL:强化学习教程》出版了!文末送书
作為人工智能里最受關注的領域之一,強化學習的熱度一直居高不下,但它的學習難度也同樣不低。
在學習強化學習的過程中,遇到了有無數資料卻難以入門的問題,于是發起了Datawhale強化學習項目,希望自學的同時幫助更多學習者輕松入門。
"蘑菇書"萃取李宏毅的深度強化學習等經典課程,結合學習者角度的理解與分析,發布9個月,就在GitHub獲得3.3k+Star和1w+下載,也有幸得到李宏毅、周博磊、李科澆等大咖老師的推薦?,F在,在人民郵電出版社的支持下,終于發布了第一版紙質書。
一、從開源到出版
從李沐開源的《動手學深度學習》,邱錫鵬的《神經網絡與深度學習》,再到Datawhale的《南瓜書》、《Easy RL:強化學習教程》出版,讓知識回歸大眾,讓大眾有機會和行業精英一樣為社會做出貢獻,是Datawhale開源內容的探索性意義。
從開源到出版,帶來的收入其實不高,但讓開源貢獻者被大眾認可是促使開源良性循環的重要一環,會促使國內的開源氛圍變好,讓更多人受益。
這本書結合了強化學習領域公開課的精華
來自中科院、清華、北大的三位發起者通過自學這3門公開課,根據自身的理解整理優化得來了《Easy RL:強化學習教程》,并且獲得了三位公開課老師的支持。
這是一本完全根據學習經歷編著而成的書
也就是說,這本書完全從讀者學習的角度出發,既有學霸學長在學習中的重點——3門公開課的精華內容,還有學霸凝練的精華和擴展的內容——作者們在大部分章末設置了原創的關鍵詞、習題和面試題,并提供Python代碼實現。幫助初學者避“坑”,用輕松的步伐入門強化學習。其實,每個人在學習一門新的課程時,都會有自己獨特的經驗和方法,這種經驗和方法的共享非常難能可貴。
二、感謝老師們的鼓勵和支持
感謝李宏毅、周博磊、李科澆、汪軍、張偉楠、李升波、胡裕靖?7位強化學習領域大咖老師的親筆認可和推薦。
在認識本書編著者之前,我就已經在網絡上注意到他們的教程“Easy-RL”,因為“Easy-RL”有部分內容改編自我在臺灣大學開授的“深度強化學習”上課視頻。當第一次看到“Easy-RL”時,我的第一個想法是:這群人把強化學習的知識整理得真好,不僅有理論說明,還加上了程序實例,同學們以后可以直接讀這套教程,這樣我上課也就不用再講強化學習的部分了。很高興王琦、楊毅遠、江季三位編著者能夠把“Easy-RL”以圖書的形式出版。
——李宏毅 臺灣大學副教授
很欣喜三位編著者能整合和升華我與另外兩位老師的強化學習公開課資料,編著出這本實用的強化學習入門教程。這本教程專注于強化學習理論與實踐相結合,通過生動的例子和動手實踐幫助讀者深入理解各種算法。以強化學習為代表的機器智能決策是人工智能的重要方向之一,希望未來更多優秀的同學可以通過這本教程和強化學習的公開課,開啟自己的研究之旅,實現類似于AlphaGo系列的開創性工作。
——周博磊,加利福尼亞大學洛杉磯分校(UCLA)
助理教授
還記得我當初自學強化學習的時候,中文資料少之又少,只能去啃國外的教材和論文;后來開設“世界冠軍帶你從零實踐強化學習”這門公開課,也是期望可以為強化學習中文社區添磚加瓦;所以很開心國內的學生能自發地形成這種公開的、系統的強化學習中文入門課程筆記的整理、分享與社區討論的氛圍。看了“Easy-RL”倉庫以及編著者發來的這本書第1章的內容,我發現這本書不僅是一個筆記合集,編著者有重點地梳理了理論,并配備了難度適中的習題實踐和面試題供讀者參考。我相信這本書的出版對于剛接觸強化學習的學生,以及準備轉行的在職人員都會有幫助。非常推薦強化學習初學者閱讀它。
——李科澆, 飛槳強化學習PARL團隊核心成員
百度高級研發工程師
王琦、楊毅遠和江季三位年輕作者,從自身學習和實踐的角度將他們對強化學習基礎內容的理解加以匯總,并完善成一本初學者之間交流、互動以及應用強化學習的實戰圖書。三位年輕作者在開源平臺中多次迭代內容,和讀者共同建立起了一套化繁為簡的、淺顯易懂的強化學習思維架構,這種做法很值得借鑒。目前,強化學習還處于高速發展期,正是年輕人施展拳腳的好賽道。這本書為強化學習的初學者和愛好者提供了一份難得的、可快速入門的學習和研究資料,相信讀者會從這本書中得到課堂之外、實用之內和興趣之中的前沿學術成果的應用知識。
——汪軍,倫敦大學學院(UCL)計算機科學系教授
近年來,國內的學習者對于強化學習的熱情日漸高漲,但是目前缺少一本適合初學者自學的書。這本書正好彌補了這一空白。由于三位編著者都是開源社區Datawhale 的成員,在這本書開源過程中得到了學習者的反饋,因此這本書更能從學習者的視角行文。全書以簡潔的語言介紹強化學習的基礎知識以及深度強化學習的內容,讓初學者能夠以輕快的步伐入門強化學習。
——張偉楠,上海交通大學計算機科學與工程系
副教授、博士生導師
強化學習是人工智能的一個重要研究領域,具有潛在的巨大應用價值。以 Al- phaZero 為代表的圍棋智能突破,也從側面證明了其解決復雜高維問題的能力。然而強化學習的應用尚處于起步階段,它既有理論學習的復雜度,又有工程實踐的挑戰性,導致初學者難以入門,更難以深入。這本書以生動形象的語言、深入淺出的邏輯,介紹了一系列基本的強化學習算法,并結合豐富有趣的經典案例講解代碼實踐,為強化學習初學者提供了一套可快速上手的學習資料。
——李升波,清華大學車輛與運載學院
長聘教授、博士生導師
《Easy RL:強化學習教程》一書很好地整合了強化學習的基礎知識、經典算法、前沿方向和尖端技術解讀,填補了國內在這方面的空白,完全可以作為中文強化學習教材。初學者通過閱讀這本書可以全方位地了解強化學習,而強化學習研究者也可以從這本書中獲得靈感和新的收獲。三位編著者并沒有用艱深晦澀的語言去描述強化學習,而是從自己的學習心得出發,將自己的學習筆記凝結成這幾十萬字的精華,娓娓道來,讓人手不釋卷。整本書的章節安排非常合理,前后章節環環相扣,既包含初學者必須掌握的關鍵知識點,也包含強化學習的前沿技術動態,展現出強化學習清晰的發展脈絡。感謝這本書的三位編著者奉獻出自己寶貴的學習經驗和知識結晶,相信未來會有很多優秀的同學因為這本書投身于強化學習的研究熱潮中。
——胡裕靖,網易伏羲強化學習研究組負責人
三、給讀者的學習建議
首先,通過關鍵詞高效入門
為了盡可能地降低閱讀門檻,作者們在“蘑菇書”中對3門公開課的精華內容進行了選取和優化,對所涉及的公式給出了詳細的推導過程,對較難理解的知識點進行了重點講解和強化,以方便讀者輕松入門。并且,為了豐富內容,書中還補充了不少3門公開課之外的強化學習相關知識。
在學習過程中,可以通過書中總結的大量關鍵詞概念,高效地回憶并掌握核心內容。
其次,可以作為面試前的準備
書籍拓展了習題和面試題:習題部分以問答的形式闡述了相應章中出現的知識點,幫助讀者厘清知識脈絡;面試題部分的內容源于大廠的算法崗面試真題,通過還原真實的面試場景和面試問題,幫助讀者開闊思路,助力大家面試理想的崗位。
▲題目配有答案詳解
最后,通過代碼實戰深入理解
強化學習是一個理論與實踐相結合的學科,我們不僅要理解算法背后的原理,還要通過上機實踐來實現算法,讓理論知識得到實際的應用。
書籍配有Python代碼實現源代碼,大家可以親自動手實現各種經典的強化學習算法,通過實戰更清晰地理解算法并快速應用。
目前是首批發行,以最低?6.9折?優惠購買,附優惠購買的海報。
最后是福利時間,評論區留言并點贊數前五的讀者,賣萌屋將分別贈送《Easy RL:強化學習教程》一本。
總結
以上是生活随笔為你收集整理的《Easy RL:强化学习教程》出版了!文末送书的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java 监控 配置 文件怎么打开_ja
- 下一篇: 知识图谱入门知识(五)【转】秒懂词向量W