當前位置：首頁 > 人工智能 > pytorch >内容正文

pytorch

深度学习之图像处理---七级浮屠

發布時間：2024/9/21 pytorch 130 豆豆

生活随笔收集整理的這篇文章主要介紹了深度学习之图像处理---七级浮屠小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

用深度學習玩圖像的七重關卡

第一個重境界：圖像識別

我們進化的方向，也就是用更高級的網絡結構取得更好的準確率，比如像下圖這樣的殘差網絡（已經可以在貓狗數據集上達到99.5%以上準確率）。分類做好了你會有一種成為深度學習大師，拿著一把斧子眼鏡里都是釘子的幻覺。分類問題之所以簡單，一要歸功于大量標記的圖像，二是分類是一個邊界非常分明的問題，即使機器不知道什么是貓什么是狗，看出點區別還是挺容易的，如果你給機器幾千幾萬類區分，機器的能力通過就下降了（再復雜的網絡，在imagenet那樣分1000個類的問題里，都很難搞到超過80%的準確率）。

第二重境界：物體檢測

很快你發現，分類的技能在大部分的現實生活里并沒有鳥用。因為現實中的任務啊，往往是這樣的：

那么多東西在一起，你拿貓狗大頭照訓練的分類網絡一下子就亂了陣腳。即使是你一個圖片里有一個貓還有一個狗，甚至給貓加點噪聲，都可以使你的分類網絡分寸大亂。

現實中，哪有那么多圖片，一個圖里就是一個貓或者美女的大圖，更多的時候，一張圖片里的東西，那是多多的，亂亂的，沒有什么章法可言的，你需要自己做一個框，把你所需要看的目標給框出來，然后，看看這些東西是什么。

于是你來到機器視覺的下一層挑戰 - 目標檢測（從大圖中框出目標物體并識別），隨之而來的是一個新的網絡架構，又被稱為R - CNN，圖片檢測網絡，這個網絡不僅可以告訴你分類，還可以告訴你目標物體的坐標，即使圖片里有很多目標物體，也一一給你找出來。

第三重境界：圖像切割

你不僅需要把圖片中邊邊角角的物體給檢測出來，你還要做這么一個猛料的工作，就是把它從圖片中扣出來。要知道，剛出生的嬰兒分不清物體的邊界，比如桌上有蘋果這種事，什么是桌子，什么是蘋果，為什么蘋果不是占在桌子上的？所以，網絡能不能把物體從一個圖里摳出來，事關它是否真的像人一樣把握了視覺的本質。這也算是對它的某種“圖靈測試” 。而把這個問題簡化，我們無非是在原先圖片上生成出一個原圖的“mask”，面具，有點像phtoshop里的蒙版的東西。

這個Segmentation任務，作用不可小瞧哦，比如現在私人衛星和無人機普及了，要不要去看看自己小區周圍的地貌，看是不是隱藏了個金庫？清清輸入，衛星圖片一欄無余。哪里有樹，哪里有水，哪里有軍事基地，不需要人，全都給你摳出來。

第四重境界：聚類

淘寶的一個功能，輸入一張服裝的圖片，然后得到一組推薦的服裝，注意啊，我可以從網絡上爬一大堆圖出來，但是這些數據是沒有標注的。怎么辦？哥告你還是有的搞，這個搞法，就是聚類。哥教你最簡單的一招聚類哦，那就是，把圖片統統放進卷積網絡，但是我們不提取分類，而只是提取一些網絡中間層的特征，這些特征有點像每個圖片的視覺二維碼，然后我們對這些二維碼做一個k-means聚類，也會得到意想不到的效果。為什么要深度？因為深度提取的特征，那是與眾不同的。然后以圖搜圖呢？不過是找到同一聚類里的其它圖片啊。

第五層境界：降噪

我們開始晉升為仰望星空的人，之前那些分類賺錢的應用太無聊了。機器視覺搞科學怎么搞？作為一群仰望星空后觀察細胞的人，我們最常發現的是我們得到的天文或者細胞圖片的噪聲實在太大了，這簡直沒法忍啊，然后，深度學習給了你一套降噪和恢復圖像的方法。一個叫auto-encoder的工具，起到了很大的作用，刷的一下，圖像就清楚了。

這還不是最酷炫的，那個應用了博弈理論的對抗學習，也可以幫你謀殺噪點！如果你會對抗所謂GAN，也是一種圖像生成的工具，讓網絡去掉噪聲的圖片，與沒有噪聲的自然圖片，連卷積網絡都判別不出來。

第六重境界：圖像翻譯

在工業界賺夠了錢，我們來玩藝術思考哲學，第一招，圖像風格遷移：

然而真正能玩好這一事項的，還是那個剛剛提過的對抗學習GAN，比如大名鼎鼎的CycleGAN，幾乎可以實現一種你自定義的“圖像翻譯” 功能，而且你不用做標注哦，拿出冬天和夏天的兩組圖片，它會自動的在兩組圖片中找出對應來。

第七重境界：GAN

圖像翻譯也懶的玩了，你神經網絡不是號稱能夠理解圖像，看你來個無中生有，在噪聲里生成圖片來？對，依然是GAN，而且是最基礎的卷積GAN (DCGAN)就可以給你干出來。看看GAN所幻想的賓館情景，你能想到是計算機做的圖嗎？哈哈哈！

寫到這里，你會覺得GAN是非常有前途的，以前我還以為只是好玩呢。

?

這里展示的七級浮屠，也不過深度學習被人類discover的冰山一角，醉臥沙場君莫笑，古來征戰幾人回。

一個稍微清晰一些的大綱：

總結

以上是生活随笔為你收集整理的深度学习之图像处理---七级浮屠的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： caffe-builder相关资料
下一篇： [计算机视觉]人脸应用：人脸检测、人脸对

pytorch

深度学习之图像处理---七级浮屠

用深度學習玩圖像的 七 重關卡

第一個重境界： 圖像識別

第二重境界 ： 物體檢測

第三重境界 ： 圖像切割