单帧图像超分辨率与深度学习
單幀圖像超分辨率技術涉及到增加小圖像的大小,同時盡可能地防止其質量下降。這一技術有著廣泛用途,包括衛星和航天圖像分析、醫療圖像處理、壓縮圖像/視頻增強及其他應用。我們將在本文借助三個深度學習模型解決這個問題,并討論其局限性和可能的發展方向。
1、單幀圖像超分辨率問題概述
我們的目標是采用一個低分辨率圖像,產生一個相應的高分辨率圖像的評估。單幀圖像超分辨率是一個逆問題:多個高分辨率圖像可以從同一個低分辨率圖像中生成。比如,假設我們有一個包含垂直或水平條的?2×2?像素子圖像(圖?1)。不管條的朝向是什么,這四個像素將對應于分辨率降低?4?倍的圖像中的一個像素。通過現實中的真實圖像,一個人需要解決大量相似問題,使得該任務難以解決。
從左到右依次是真值?HR?圖像、相應的?LR?圖像和一個訓練用來最小化?MSE?損失的模型的預測。
首先,讓我們先了解一個評估和對比模型的量化質量檢測方法。對于每個已實現的模型,我們會計算一個通常用于測量有損壓縮編解碼器重建質量的指標,稱之為峰值信噪比(PSNR/Peak?Signal?to?Noise?Ratio)。這一指標是超分辨率研究中使用的事實標準。它可以測量失真圖像與原始高質量圖像的偏離程度。在本文中,PSNR?是原始圖像與其評估版本(噪聲強度)之間圖像(信號強度)可能的最大像素值與最大均方誤差(MSE)的對數比率。
PSNR?值越大,重建效果越好,因此?PSNR?的最大值化自然會最小化目標函數?MSE。實驗中,訓練模型把輸入圖像的分辨率提升四倍(就寬度和高度而言)。在這一因素之上,哪怕提升小圖像的分辨率也變的很困難。比如,一張分辨率提升了八倍的圖像,其像素數量擴大了?64?倍,因此需要另外的原始格式的?64?倍內存存儲它,而這是在訓練之中完成的。
2、為什么選擇深度學習
提高圖像分辨率的最常用技術之一是插值(interpolation)。盡管易于實現,這一方法在視覺質量方面依然有諸多不足,比如很多細節(比如尖銳的邊緣)無法保留。
更復雜的方法則利用給定圖像的內部相似性或者使用低分辨率圖像數據集及其對應的高質量圖像,有效地學習二者之間的映射。
在基于實例的?SR?算法中,稀疏編碼方法是較為流行的方法之一。這一方法需要找到一個詞典,把低分辨率圖像映射到一個中間的稀疏表征。此外,HR?詞典已被學習,允許我們存儲一個高分辨率圖像的評估。該流程通常涉及若干個步驟,且無法全部優化。理想情況下,把這些步驟合而為一,其中所有部分皆可優化。這種效果可以通過神經網絡來達到,網絡架構受到稀疏編碼的啟發。
總結
以上是生活随笔為你收集整理的单帧图像超分辨率与深度学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: html2canvas (踩坑) 网络图
- 下一篇: 简洁优美的深度学习包-bert4kera