日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

如何评估深度学习模型效果?阿里工程师这么做

發布時間:2024/8/23 pytorch 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 如何评估深度学习模型效果?阿里工程师这么做 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

復雜的深度模型中,如果效果不好,是因為網絡設計的欠缺?還是數據天然缺陷?是訓練代碼的bug?還是Tensorflow自身的問題?基于此,阿里工程師推出了DeepInsight深度學習質量平臺,致力于解決當前模型調試和問題定位等一系列問題。接下來,阿里巴巴高級技術專家、DeepInsight深度學習質量平臺技術負責人:孫凱(花名:路宸),帶我們一起探索。

1. 背景

機器學習訓練過程的調試、可視化以及訓練效果的評估一直是業界難題。在數據較少,模型較簡單,如LR、GBDT、SVM,超參不多的情況下,模型的可調性和可解釋性都有一定保障,那么我們用簡單的訓練,再觀察召回/精度/AUC等指標就可以應對。

而深度學習時代,模型的復雜性遠遠超乎想象,層層嵌套的網絡結構,優化器和大量超參的選擇,特征的連續化,一起構建了復雜的深度模型。如果效果不好,其原因是多樣的,為了定位和解決這些問題,算法研發同學需要花費大量精力反復嘗試,而且很可能得不到準確的答案。簡單來說,網絡模型近似于黑盒。

?

  • DeepInsight
  • 通過研究,我們發現訓練和評估過程中大量中間指標與模型效果能產生關系,通過系統的分析建模張量、梯度、權重和更新量,能夠對算法調優、問題定位起到輔助決策作用。而且,通過改進AUC算法,分析ROC、PR、預估分布等更多評估指標,能夠更全面地評估模型效果。

    通過2個多月的努力,我們推出了DeepInsight平臺,致力于解決當前模型調試和問題定位等一系列問題。提交模型開始訓練之后,用戶可以通過DeepInsight平臺,能一站式查看并分析訓練過程,從訓練中間指標到預測指標,再到性能數據,一應俱全。對于訓練中明顯的問題,平臺也會高亮給予提示。未來,我們希望平臺能更好地幫助用戶發現和定位訓練中的問題,并能給予適當提示(如更改某些子網絡的最優化算法、更改學習率動量等),就如同GDB之于C++一樣。


    2.1 目標

    沉淀并持久化訓練數據。深度學習的數據非常寶貴,每次訓練的網絡拓撲、參數、訓練中間過程、模型評估指標都會持久存儲,方便后續人工分析和二次建模;

    沉淀對模型訓練的認識,提供分析調優手段,輔助決策,同時規避各類已知問題;

    利用大數據分析建模,尋找中間過程指標的關系,更好地輔助決策,我們稱這個目標為Model on Model,即利用新的模型來分析評估深度模型;

    在大數據分析建模的基礎上,嘗試對已有模型進行深度強化學習(DRL),提高深度學習調試效率。


    2.2 架構

    系統主要分為四層:輸入層、解析層、評估層、輸出層;

    同時包括五大組件:Tensorboard+可視化分析;TensorViewer日志展示對比;TensorDealer集成配置;TensorTracer數據透出;TensorDissection分析調優。


    2.3 進展

    2.3.1 高性能可視化組件TensorBoard+

    Google的TensorBoard(簡稱為TB)是TensorFlow(簡稱為TF)的可視化組件,可以查看深度學習的網絡結構、中間指標等。原生的TB是單機版命令行方式運行,無法多用戶使用;易用性差,每次切換日志路徑都需要kill掉當前進程;同時性能也很差,加載工業模型數據立即卡死;指標分層混亂,幾千個指標全都羅列,無法查看;用法復雜功能較弱,不支持已展示圖形的二次數據對比,不支持X軸浮點數據展示等。

    因此,我們重構了TB的核心代碼,支持GB級日志加載和數據分層,將整個服務改造成多用戶版本,利用Docker靈活管理資源并自動回收。UI上支持了高亮自定義指標、分層展示、數據對比、日志上傳等,具體如下:

    支持在線更改TF日志路徑:

    支持圖形數據在線聚合對比:

    支持X軸浮點數值類型展示:

    支持圖形數據Hightlight分維度顯示:

    支持手動調整前端定時刷新時間,實時展示數據:

    2.3.2 集成配置日志管理系統TensorViewer

    TF的任務缺乏有效管理,用戶無法按需查看和分析數據,更無法回顧歷史數據。我們打通了TF與DeepInsight的通路,收集了所有任務的信息,用戶可以查看每次訓練的實時數據和所有歷史數據,支持多任務對比分析;同時支持一鍵跳轉到Tensorboard+,直接對當前日志數據進行可視化展示。

    2.3.3 改進TensorFlow的可視化數據透出

    我們定義了一套數據透出方式,可以把所有內部數據透出成統一的Summary格式,并被Tensorboard+處理。由于PS架構沒有Master集中處理中間數據,再加上張量、梯度等指標的透出是極為消耗資源的,所以,如何透出數據是值得深入研究的。當前我們在Worker0上透出數據,能滿足一般模型訓練的要求,未來,會研究Snapshot數據透出方案,在大規模網絡下也能取得較好效果。

    當前,我們已經初步解析了Tensorflow透出的過程指標,正在這些海量指標上進行有監督和無監督的建模探索。

    2.3.4 改進模型評估指標

    Tensorflow自帶的AUC計算方式分桶較少,計算精度有bug,在處理大量數據時性能不夠,而且,僅僅能計算AUC,無法繪制ROC、PR等曲線。

    我們改進了計算方式,引入更多桶,并提升計算效率,同時,繪制了更多新的指標。當前繪制的指標包括AUC、ROC、PR、波動率、正負樣本分桶分布。通過觀察正負樣本的分布,我們發現Tensorflow異步計算的缺陷,導致某些桶的樣本數量有誤差,會帶來AUC上極小波動,這個bug目前尚未解決。所有的預估指標都無縫接入DeepInsight平臺。

    2.3.5 研究模型訓練中間指標

    通過深入觀察和建模大規模Embedding子網絡的訓練指標,我們發現權重(偏置)值的變化可以反應出相關網絡結構是否被有效訓練。權重(偏置)值變化微弱的區域即為訓練的“盲區”—該部分網絡沒有被訓練起來。通過觀察權重(偏置)的梯度,可以幫助我們診斷梯度彌散或梯度爆炸等問題,分析了解訓練該部分網絡的難易程度,有針對性地調整優化器以及學習率等設置。通過全面考察整個網絡各部分的激活以及梯度,可以幫助我們深入了解整個網絡前后向多路信息相互耦合、協同傳導的復雜機制,從而更有效地進行模型結構的設計調優。

    對中間指標的研究會沉淀回流到DeepInsight,在訓練指標產出后,對用戶給予提示,做到輔助決策的作用。


    原文鏈接
    本文為云棲社區原創內容,未經允許不得轉載。

    總結

    以上是生活随笔為你收集整理的如何评估深度学习模型效果?阿里工程师这么做的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 久久精品国产亚洲AV成人雅虎 | 性自由色xxxx免费视频 | 亚洲麻豆一区二区三区 | 日韩视频免费播放 | 四虎影视成人永久免费观看亚洲欧美 | 国产做爰免费观看视频 | 91av成人| 91人人澡人人爽人人精品 | 国产日韩三级 | 色欧美综合 | 91爱爱网站 | 蜜色av | 成年人免费网址 | 日本男人的天堂 | 国产日批视频 | 麻豆精品自拍 | 免费在线看污片 | 日韩少妇av| 91网站观看 | 国产成人精品免费视频 | 欧美一区二区视频在线观看 | 国产精品无码专区av在线播放 | 无遮挡毛片| 中文字幕.com| 欧美在线 | 伊人论坛 | 字幕网av | 伊人青草| 久久久久久久久久久久久久久 | 丰满少妇被猛烈进入无码 | 精品国产乱码久久久久久久软件 | 日韩欧美不卡在线 | 男女羞羞动态图 | 成人午夜视频免费观看 | 好爽…又高潮了毛片免费看 | 狠狠躁日日躁夜夜躁2022麻豆 | 国产精品专区在线观看 | 在线观看一区二区三区四区 | 久久精品国产一区二区三区 | 岛国精品在线观看 | 草草久久久 | 69影院少妇在线观看 | 99国产精品久久 | 三级全黄做爰龚玥菲在线 | 国产尤物视频在线观看 | 亚洲一级免费毛片 | 黑人操欧美人 | 日日夜夜网 | 狠狠干,狠狠操 | 亚洲午夜18毛片在线看 | 大肉大捧一进一出好爽视频动漫 | 国产成人精品免费在线观看 | 青青导航 | 深夜视频在线观看 | 136fldh导航福利微拍 | 亚洲制服无码 | 欧美国产日韩综合 | 国产综合久久 | 亚洲激情第一页 | 成人影视在线播放 | 亚洲精品无人区 | www.xxx.日本| 久久久成人精品视频 | 男女69视频 | 国产精品黄色片 | 国产乱码77777777 | www日韩在线观看 | 爱爱的免费视频 | 桃色激情网 | 欧美黑人啪啪 | 五月婷婷六月丁香综合 | 欧美日韩不卡一区二区 | 夜夜爱视频 | 亚洲视频一区在线播放 | 一区二区的视频 | 国产精品v亚洲精品v日韩精品 | 精品国产乱码久久久久久郑州公司 | 欧美精品成人久久 | 男女床上拍拍拍 | 91国偷自产中文字幕久久 | 日韩av在线播放不卡 | 欧美交换国产一区内射 | 黄色一级片在线免费观看 | 久久精品国产亚洲AV黑人 | 白嫩初高中害羞小美女 | 真实乱视频国产免费观看 | 国产视频一区二区不卡 | 久久精品国产亚洲av蜜臀色欲 | 丰满少妇麻豆av苏语棠 | 日韩一区欧美 | 国产精品69久久久久孕妇欧美 | 黄色国产免费 | 女人免费视频 | 男女交性视频播放 | 久久a视频 | 日本老肥婆bbbwbbbwzr | av在线不卡网 | 一级特黄aaaaaa大片 | 2017狠狠干 |