【每周CV论文】初学深度学习图像超分辨应该要读的文章
歡迎來到《每周CV論文》。在這個專欄里,還是本著有三AI一貫的原則,專注于讓大家能夠系統性完成學習,所以我們推薦的文章也必定是同一主題的。
圖像超分辨是一個非常實際應用價值的方向,今天給大家推薦初學該領域必須要讀的文章。
作者&編輯 | 言有三
1?SRCNN
SRCNN方法[1]是將深度學習用于圖像超分辨領域中最早期的嘗試,它是一個前上采樣結構,可以看作是經典的稀疏編碼用深度學習模型進行實現。
文章引用量:2700+
推薦指數:?????
[1] Dong C, Loy C C, He K, et al. Image super-resolution using deep convolutional networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2015, 38(2): 295-307.
2 ESPCN
SRCNN等前上采樣框架中首先使用反卷積來完成上采樣,這是一種很自然的操作,但是它計算復雜度較大,Twitter圖片與視頻壓縮研究組則采用了與反卷積完全不同的上采樣思路,提出了ESPCN模型[2],其中核心思想是亞像素卷積(sub-pixel convolution),這是一種后上采樣框架。
文章引用量:1200+
推薦指數:?????
[2] Shi W, Caballero J, Huszar F, et al. Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network[C]. computer vision and pattern recognition, 2016: 1874-1883.
3?Perceptual loss
早期的基于CNN模型的超分辯框架如SRCNN,ESPCN都使用圖像像素空間的歐式距離作為優化目標,結果能取得較高的PSNR和SSIM指標,但是存在結果過于平滑的問題,后來的研究者將SRCNN模型的像素損失改為感知損失后,顯著提高了視覺效果。
文章引用量:2000+
推薦指數:?????
[3] Johnson J, Alahi A, Fei-Fei L. Perceptual losses for real-time style transfer and super-resolution[C]//European conference on computer vision. Springer, Cham, 2016: 694-711.
4 SRGAN
隨著生成對抗網絡GAN的發展,生成器和判別器的對抗學習機制在圖像生成任務中展現出很強大的學習能力。Twitter的研究者們使用ResNet作為生成器結構,使用 VGG作為判別器結構,提出了SRGAN[4]模型。
文章引用量:1400+
推薦指數:?????
[4] Ledig C, Theis L, Huszár F, et al. Photo-realistic single image super-resolution using a generative adversarial network[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 4681-4690.
5 無監督模型
由于大部分模型都是基于成對的低分辨率和高分辨率圖進行訓練,研究者常通過固定的圖像算法對高分辨率圖進行采樣獲得低分辨率圖,這與真實的圖像蛻化過程并不一致,真實的圖像蛻化往往包括各類模糊和噪聲,缺陷等。因此,如何擺脫仿真數據集進行訓練,產生真實的訓練數據對模型泛化到真實場景非常重要,其中基于GAN的無監督模型大有可為。
文章引用量:70+
推薦指數:?????
[5] Bulat A, Yang J, Tzimiropoulos G. To learn image super-resolution, use a gan to learn how to do image degradation first[C]//Proceedings of the European conference on computer vision (ECCV). 2018: 185-200.
6 應用
圖像超分辨可以用于老照片和視頻的修復,同時也可以用于輔助目標檢測等任務中提升目標的可辨識度,其中在人臉領域是最為成熟的應用方向[6-7],值得關注。
[6] Chen Y, Tai Y, Liu X, et al. FSRNet: End-to-End Learning Face Super-Resolution with Facial Priors[C]. computer vision and pattern recognition, 2018: 2492-2501.
[7]?Menon S, Damian A, Hu S, et al. PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models[J]. arXiv: Computer Vision and Pattern Recognition, 2020.
7 文章解讀
關于圖像超分辨以及相關文章的詳細解讀,在有三AI知識星球-網絡結構1000變-圖像增強以及GAN下有較多的文章,感興趣可以移步。
總結
本次我們介紹了初學圖像超分辨領域值得讀的文章,當前研究重點在于無監督模型,復雜退化類型圖像的超分辨等方向,讀者可以繼續關注。
有三AI知識星球
知識星球是有三AI的付費內容社區,里面包括各領域的模型學習,數據集下載,公眾號的付費圖文原稿,技術總結PPT和視頻,知識問答,書籍下載,項目推薦,線下活動等資源,了解詳細請閱讀以下文章:
【雜談】有三AI知識星球一周年了!為什么公眾號+星球才是完整的?
【雜談】萬萬沒想到,有三還有個保密的‘朋友圈’,那里面都在弄啥!
轉載文章請后臺聯系
侵權必究
往期精選
【每周論文推薦】 初入深度學習CV領域必讀的幾篇文章
【每周CV論文推薦】 掌握殘差網絡必讀的10多篇文章
【每周CV論文推薦】 初學者必須精讀的5篇深度學習優化相關文章
【每周CV論文推薦】 CV領域中數據增強相關的論文推薦
【每周CV論文推薦】 初學高效率CNN模型設計應該讀的文章
【每周CV論文推薦】 初學目標檢測必須要讀的文章
【每周CV論文推薦】 初學深度學習圖像分割必須要讀的文章
【每周CV論文推薦】 初學GAN必須要讀的文章
【每周CV論文推薦】 深度學習人臉檢測入門必讀文章
【每周CV論文推薦】 初學深度學習人臉關鍵點檢測必讀文章
【每周CV論文推薦】 初學深度學習人臉識別和驗證必讀文章
【每周CV論文推薦】 初學深度學習人臉屬性分析必讀的文章
【每周CV論文推薦】 初學活體檢測與偽造人臉檢測必讀的文章
【每周CV論文推薦】 初學深度學習單張圖像三維人臉重建需要讀的文章
【每周CV論文推薦】 人臉識別剩下的難題:從遮擋,年齡,姿態,妝造到親屬關系,人臉攻擊
【每周CV論文推薦】換臉算法都有哪些經典的思路?
【每周CV論文】深度學習文本檢測與識別入門必讀文章
【每周CV論文】深度學習圖像降噪應該從閱讀哪些文章開始
【每周CV論文】初學GAN圖像風格化必須要讀的文章
總結
以上是生活随笔為你收集整理的【每周CV论文】初学深度学习图像超分辨应该要读的文章的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【信息抽取】如何使用循环神经网络进行关系
- 下一篇: 【星球知识卡片】深度学习换脸算法都有哪些