MegEngine 框架设计
MegEngine 框架設計
MegEngine 技術負責人許欣然將帶了解一個深度學習框架是如何把網絡的定義逐步優化并最終執行的,從框架開發者的視角來看待深度學習。
背景
AI 浪潮一波又一波,仿佛不會算法就落后于時代。
深度學習框架處理了各種設備的計算細節、求導、計算優化序列的工作,而在動態、靜態兩套截然不同的世界中,這些步驟又各自有他們不同的優化點和瓶頸。
如何在中間獲取一個高效的平衡呢?以及如何克服訓練完的模型在推理部署中無數的坑(聞者落淚),那個堪稱對此進行降維打擊的“訓練推理一體化”到為何物?
分享內容
MegEngine 天元作為曠視全員自用6年的自研深度學習框架,是一個在淘金熱時,堅持選擇賣鏟子的團隊。了解一個深度學習框架是如何把網絡的定義逐步優化并最終執行的,從框架開發者的視角來看待深度學習。
視頻地址: https://www.bilibili.com/video/BV11C4y1t7xH
課件地址:金槍魚之夜:MegEngine 框架設計.pdf
分享大綱
? 背景介紹
o 深度學習框架是干啥的?
o 道理我都懂,為什么又搞一個深度學習框架?
o 你們為啥不用 PyTorch / TensorFlow?
o 訓推一體是個啥玩意?
? 如何寫出一個深度學習框架?(超簡化版)
o 動態圖訓練
o 調用 = 執行
o 依賴關系圖 forward & backward
o megdnn kernel
o exec
o Shape Deduce
o 靜態圖訓練 + 推理(粗糙版)
? Tensor
? Graph、SymborVar
? CompNode
? Shape Inference
? Graph Optimization
? 拓撲排序
? 內存優化
? Computing Sequence
? 一個陳年靜態圖框架是怎么變成動態圖框架的?
o Dynamic Region
o Eager Graph
o Eager Runtime + Proxy Graph
? 對未來的展望
o 各種芯片模組的對接,挑戰訓推一體的理念
o MLIR 等技術的興起
o 如何做到真 JIT
總結
以上是生活随笔為你收集整理的MegEngine 框架设计的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 旷视MegEngine核心技术升级
- 下一篇: MegEngine计算图、MatMul优