當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

直播 NO.5 | Facebook 田渊栋：用深度（强化）学习为组合优化寻找更好的启发式搜索策略...

發布時間：2025/3/8 编程问答 52 豆豆

生活随笔收集整理的這篇文章主要介紹了直播 NO.5 | Facebook 田渊栋：用深度（强化）学习为组合优化寻找更好的启发式搜索策略... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

↑↑↑↑↑點擊上方藍色字關注我們！

『運籌OR帷幄』原創

對這次分享主題感興趣的小伙伴，

歡迎在文末留言提問，

我們會收集有價值的問題，

請嘉賓在直播中親自解答。

分享提綱

主題：《用深度（強化）學習為組合優化尋找更好的啟發式搜索策略》

嘉賓：田淵棟博士

時間：北京時間 2020年 2月23號（周日）早 10：00

地點：『運籌OR帷幄』嗶哩嗶哩直播間

鏈接：live.bilibili.com/21459168

題目
Learning heuristic with Deep Learning and Reinforcement Learning for combinatorial optimization problems?

簡介

本次直播我們有幸請到 Facebook AI Lab 的田淵棟博士，為大家介紹他和團隊近期在頂會 NeurIPS 和 ICLR 發表的三篇文章 [1] [2] [3]，內容涉及用（深度）強化學習和搜索方法搭配神經網絡來尋找復雜優化問題的啟發式算法的一些工作。

近年來，深度學習在處理自然數據輸入(如計算機視覺、語音識別和自然語言處理)方面成績斐然。然而，怎樣用深度神經網絡來處理結構化的數據，（如日志，優化問題的結構化描述，代碼)，為一些離散優化問題找到一條替代人力啟發式策略的神經網絡方案，仍然是個未解決的問題。本次直播，我將簡要介紹近期我們用強化學習和搜索方法搭配神經網絡，來尋找復雜優化問題的啟發式算法的一些工作。涉及到的應用領域包括：化簡符號表達式、在線事務調度、車輛路徑規化、神經網絡架構搜索，以及從匯編代碼中反編譯出C代碼。

嘉賓介紹

田淵棟博士，臉書（Facebook）人工智能研究院研究員及經理，研究方向為深度強化學習，多智能體學習，及其在游戲中的應用，和深度學習模型的理論分析。曾擔任圍棋開源項目 DarkForest 及 ELF OpenGo 項目中研究及工程負責人和第一作者。2013-2014年在Google無人駕駛團隊任軟件工程師。2005年及08年于上海交通大學獲本碩學位，2013年于美國卡耐基梅隆大學機器人研究所獲博士學位。曾獲得2013年國際計算機視覺大會（ICCV）馬爾獎提名（Marr Prize Honorable Mentions）。

? ? ? ?

掃描二維碼直達『運籌OR帷幄』B 站直播間

對這次分享主題感興趣的小伙伴，歡迎在文末留言提問，我們會收集有價值的問題，請嘉賓在直播中親自解答

參考文獻：

[1] Chen, X., & Tian, Y. (2019). Learning to perform local rewriting for combinatorial optimization. In?Advances in Neural Information Processing Systems?(pp. 6278-6289).

[2] Fu, C., Chen, H., Liu, H., Chen, X., Tian, Y., Koushanfar, F., & Zhao, J. (2019). Coda: An end-to-end neural program decompiler. In?Advances in Neural Information Processing Systems?(pp. 3703-3714).

[3] Wang, L., Xie, S., Li, T., Fonseca, R., & Tian, Y. (2019). Sample-efficient neural architecture search by learning action space.?arXiv preprint arXiv:1906.06832.

相關文章推薦

強化學習已經取得像AlphaGo這樣舉世矚目的成績，也成為最近的一個研究熱點。組合優化是應用數學、計算機科學、運籌學等領域的重要問題，在調度、資源分配、物流、城市規劃、電路設計、制藥等領域應用廣泛。強化學習與組合優化結合，能產生什么新機會？本次『運籌OR帷幄』社群線上直播，我們有幸邀請到了人工智能公司attain.ai.創始人，加拿大阿爾伯塔大學計算機系博士李玉喜先生，結合具體場景，為我們講解強化學習在組合優化中的應用。

點擊藍字標題，即可閱讀《直播回顧 | Attain.ai 創始人李玉喜：強化學習遇見組合優化》

往期直播回顧

直播NO.1 | PLM 合伙人李偉：從第一方物流到第五方物流，淺談物流服務的演進

直播 NO.2 | 胡武華博士：運籌優化理論在物流行業中的應用實踐

直播 NO.3 | 滴滴 AI Labs 秦志偉：深度強化學習在網約車交易市場中的應用

直播 NO.4 | 李玉喜博士：強化學習遇見組合優化

文案：p、張長浩

技術：小王

審核編輯：阿春

微信編輯：葡萄

總結

以上是生活随笔為你收集整理的直播 NO.5 | Facebook 田渊栋：用深度（强化）学习为组合优化寻找更好的启发式搜索策略...的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：一篇文章把Self-Attention与
下一篇：一些在NLP的面试中提问频率非常高的问题