深度学习之图像处理---七级浮屠
用深度學習玩圖像的 七 重關卡
第一個重境界: 圖像識別
我們進化的方向,也就是用更高級的網絡結構取得更好的準確率,比如像下圖這樣的殘差網絡(已經可以在貓狗數據集上達到99.5%以上準確率)。分類做好了你會有一種成為深度學習大師,拿著一把斧子眼鏡里都是釘子的幻覺。 分類問題之所以簡單, 一要歸功于大量標記的圖像, 二是分類是一個邊界非常分明的問題, 即使機器不知道什么是貓什么是狗, 看出點區別還是挺容易的, 如果你給機器幾千幾萬類區分, 機器的能力通過就下降了(再復雜的網絡,在imagenet那樣分1000個類的問題里,都很難搞到超過80%的準確率)。
第二重境界 : 物體檢測
很快你發現,分類的技能在大部分的現實生活里并沒有鳥用。因為現實中的任務啊, 往往是這樣的:
那么多東西在一起,你拿貓狗大頭照訓練的分類網絡一下子就亂了陣腳。 即使是你一個圖片里有一個貓還有一個狗,甚至給貓加點噪聲,都可以使你的分類網絡分寸大亂。
現實中, 哪有那么多圖片, 一個圖里就是一個貓或者美女的大圖,更多的時候, 一張圖片里的東西, 那是多多的, 亂亂的,沒有什么章法可言的, 你需要自己做一個框, 把你所需要看的目標給框出來, 然后, 看看這些東西是什么 。
于是你來到機器視覺的下一層挑戰 - 目標檢測(從大圖中框出目標物體并識別), 隨之而來的是一個新的網絡架構, 又被稱為R - CNN, 圖片檢測網絡 , 這個網絡不僅可以告訴你分類,還可以告訴你目標物體的坐標, 即使圖片里有很多目標物體, 也一一給你找出來。
第三重境界 : 圖像切割
你不僅需要把圖片中邊邊角角的物體給檢測出來, 你還要做這么一個猛料的工作, 就是把它從圖片中扣出來。 要知道, 剛出生的嬰兒分不清物體的邊界, 比如桌上有蘋果這種事, 什么是桌子,什么是蘋果,為什么蘋果不是占在桌子上的? 所以, 網絡能不能把物體從一個圖里摳出來, 事關它是否真的像人一樣把握了視覺的本質。 這也算是對它的某種“圖靈測試” 。 而把這個問題簡化,我們無非是在原先圖片上生成出一個原圖的“mask”, 面具,有點像phtoshop里的蒙版的東西。
這個Segmentation任務, 作用不可小瞧哦, 比如現在私人衛星和無人機普及了,要不要去看看自己小區周圍的地貌, 看是不是隱藏了個金庫? 清清輸入, 衛星圖片一欄無余。 哪里有樹, 哪里有水,哪里有軍事基地,不需要人,全都給你摳出來。
第四重境界:聚類
淘寶的一個功能,輸入一張服裝的圖片,然后得到一組推薦的服裝, 注意啊,我可以從網絡上爬一大堆圖出來,但是這些數據是沒有標注的。怎么辦? 哥告你還是有的搞,這個搞法,就是聚類。哥教你最簡單的一招聚類哦,那就是, 把圖片統統放進卷積網絡,但是我們不提取分類,而只是提取一些網絡中間層的特征, 這些特征有點像每個圖片的視覺二維碼,然后我們對這些二維碼做一個k-means聚類, 也會得到意想不到的效果。 為什么要深度? 因為深度提取的特征,那是與眾不同的。然后以圖搜圖呢? 不過是找到同一聚類里的其它圖片啊。
第五層境界 :降噪
我們開始晉升為仰望星空的人, 之前那些分類賺錢的應用太無聊了。 機器視覺搞科學怎么搞? 作為一群仰望星空后觀察細胞的人,我們最常發現的是我們得到的天文或者細胞圖片的噪聲實在太大了, 這簡直沒法忍啊, 然后, 深度學習給了你一套降噪和恢復圖像的方法。 一個叫auto-encoder的工具, 起到了很大的作用 , 刷的一下,圖像就清楚了。
這還不是最酷炫的,那個應用了博弈理論的對抗學習, 也可以幫你謀殺噪點! 如果你會對抗所謂GAN, 也是一種圖像生成的工具, 讓網絡去掉噪聲的圖片,與沒有噪聲的自然圖片, 連卷積網絡都判別不出來。
第六重境界 :圖像翻譯
在工業界賺夠了錢, 我們來玩藝術思考哲學 ,第一招, 圖像風格遷移:
然而真正能玩好這一事項的,還是那個剛剛提過的對抗學習GAN, 比如大名鼎鼎的CycleGAN, 幾乎可以實現一種你自定義的“圖像翻譯” 功能,而且你不用做標注哦, 拿出冬天和夏天的兩組圖片, 它會自動的在兩組圖片中找出對應來。
第七重境界:GAN
圖像翻譯也懶的玩了, 你神經網絡不是號稱能夠理解圖像,看你來個無中生有,在噪聲里生成圖片來?對,依然是GAN,而且是最基礎的卷積GAN (DCGAN)就可以給你干出來。看看GAN所幻想的賓館情景, 你能想到是計算機做的圖嗎? 哈哈哈!
寫到這里, 你會覺得GAN是非常有前途的,以前我還以為只是好玩呢。
?
這里展示的七級浮屠,也不過深度學習被人類discover的冰山一角, 醉臥沙場君莫笑, 古來征戰幾人回。
一個稍微清晰一些的大綱:
總結
以上是生活随笔為你收集整理的深度学习之图像处理---七级浮屠的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: caffe-builder相关资料
- 下一篇: [计算机视觉]人脸应用:人脸检测、人脸对