日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【知识星球】有没有网络模型是动态变化的,每次用的时候都不一样?

發布時間:2025/3/20 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【知识星球】有没有网络模型是动态变化的,每次用的时候都不一样? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

歡迎大家來到《知識星球》專欄,這里是網絡結構1000變小專題,今天給大家介紹一類網絡結構,它是動態變化的,每一次使用的時候都不一樣。

作者&編輯 | 言有三

1 訓練時變化的網絡結構

首先我們看第一種,即訓練的時候拓撲結構發生動態變化的,最熟悉的是什么?Dropout和DropConnect對吧!

大家都知道的我們肯定是不會講了,下面給大家講一個非常優秀的研究。

有三AI知識星球-網絡結構1000變

Stochastic Depth

多個獨立研究表明實際上ResNet的有效深度沒有想象中那么深,152層的網絡有效深度也就是40多層左右,怎么去研究這個問題呢?

作者/編輯 言有三

stochastic depth對此做出了研究,它做的事情很簡單,就是在訓練的時候把殘差網絡的單元隨機刪減掉一些,測試時不變,所以網絡訓練的時候是一個比測試時更淺層的網絡。

實驗證明這不僅減小了訓練時間,還提升了測試精度,實驗結果如下:

從這兩個圖可以看出,加上隨機刪減后測試集的精度在CIFAR10和CIFAR100上都有所提升了。與基礎ResNet結構相比,測試集的精度大于訓練集,證明網絡過擬合大大下降。下面SVHN的結果更加印證了這一點,穩穩地壓倒普通ResNet網絡。

另一方面再看右上圖,1201層的網絡的性能也很不錯,不僅僅沒有過擬合,而且相對于152層的ResNet性能還能夠繼續提升,這就相當不易了。

上面展示了實驗結果,那為什么有效呢?作者給出了一點解釋。即這樣的網絡梯度更大更有效,如下圖第一個卷積層的對比:

隨機刪減網絡的梯度始終比普通ResNet更大,而且學習率下降后更加明顯。

[1] Huang G, Sun Y, Liu Z, et al. Deep networks with stochastic depth[C]//European conference on computer vision. Springer, Cham, 2016: 646-661.

Stochstic depth網絡本質上可以看作是多個網絡的集成,與Dropout等技術一樣在訓練時結構發生變化,能提高模型的表達能力。

2?測試時變化的網絡結構

上面說了訓練時發生變化的網絡,那有沒有測試時也發生動態變化的網絡呢?

有三AI知識星球-網絡結構1000變

BranchyNet

通常來說模型訓練完之后結構就是固定的,測試時圖片沿著固定的通路進行計算。然而測試樣本本身有不同的難度,簡單的樣本只需要少量的計算量就可以完成任務,困難的樣本則需要更多的計算量。BranchyNet就可以根據不同難度的圖片,使用不同的計算通路,從而使計算更加高效。

作者/編輯 言有三

如上圖所示,它在正常網絡通道上包含了多個旁路分支,這樣的思想是基于觀察到隨著網絡的加深,表征能力越來越強,大部分簡單的圖片可以在較淺層時學習到足以識別的特征,如上圖中的Exit 1通道。一些更難的樣本需要進一步的學習,如上圖中的Exit 2通道,而只有極少數樣本需要整個網絡,如Exit3通道。這樣的思想可以實現精度和計算量的平衡,對于大部分樣本,可以用更小的計算量完成任務。

那么如何判斷是否可以提前結束呢?在提出該網絡的論文中,作者采用分類信息熵,一旦該通道的分類信息熵低于某一個閾值,說明已經以很高的置信度獲得了分類的結果,直到最終的通道。

在訓練的時候,每一個通道都會對損失有貢獻,越靠近淺層的網絡權重越大。多通道的損失不僅增強了梯度信息,也在一定程度上實現了正則化。

將BranchyNet的設計思想用于LeNet,AlexNet,ResNet結構后,在維持性能的前提下,加速效果明顯。

對于擁有N個分支的網絡,需要的就是N-1個閾值,因為最后一個分支不需要閾值。

LeNet系列網絡可以讓超過90%的樣本在第一個分支提前終止,AlexNet提前終止樣本比例也超過一半,ResNet提前終止樣本比例超過了40%。

[1] Teerapittayanon S, McDanel B, Kung H T. Branchynet: Fast inference via early exiting from deep neural networks[C]//2016 23rd International Conference on Pattern Recognition (ICPR). IEEE, 2016: 2464-2469.

更多相關內容請大家移步有三AI知識星球。

3 關于有三AI知識星球

有三AI知識星球是我們繼公眾號之后重點打造的原創知識學習社區,有需要的同學可以閱讀下文加入,添加有三微信加入還有優惠。

【雜談】為什么邀請大家加入硬核知識星球有三AI

有三AI知識星球的內容非常多,大家可以預覽一些內容如下。

以上所有內容

加入有三AI知識星球即可獲取

來日方長

點擊加入

不見不散

更多精彩

每日更新

轉載文章請后臺聯系

侵權必究

往期精選

  • 揭秘7大AI學習板塊,這個星球推薦你擁有

  • 有三AI 1000問回歸,備戰秋招,更多,更快,更好,等你來戰!

  • 有三AI“夏季劃”出爐,今夏進階中級CV算法工程師

  • 【知識星球】做作業還能贏獎金,傳統圖像/機器學習/深度學習盡在不言

  • 【知識星球】顏值,自拍,美學三大任務簡介和數據集下載

  • 【知識星球】數據集板塊重磅發布,海量數據集介紹與下載

  • 【知識星球】貓貓狗狗與深度學習那些事兒

  • 【知識星球】超3萬字的網絡結構解讀,學習必備

  • 【知識星球】視頻分類/行為識別網絡和數據集上新

  • 【知識星球】3D網絡結構解讀系列上新

  • 【知識星球】動態推理網絡結構上新,不是所有的網絡都是不變的

  • 【知識星球】Attention網絡結構上新,聚焦才能贏

  • 【知識星球】幾個人像分割數據集簡介和下載

  • 【知識星球】總有些骨骼輕奇,姿態妖嬈的模型結構設計,不知道你知不知道,反正我知道一些

  • 【知識星球】從SVM對偶問題,到疲勞駕駛檢測,到實用工業級別的模型壓縮技

  • 【知識星球】圖像降噪模型和數據集內容開啟更新,經典問題永垂不朽

總結

以上是生活随笔為你收集整理的【知识星球】有没有网络模型是动态变化的,每次用的时候都不一样?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。