图像处理与计算机视觉:基础,经典以及最近发展(4)图像处理与分析
本章主要討論圖像處理與分析。雖然后面計(jì)算機(jī)視覺(jué)部分的有些內(nèi)容比如特征提取等也可以歸結(jié)到圖像分析中來(lái),但鑒于它們與計(jì)算機(jī)視覺(jué)的緊密聯(lián)系,以及它們的出處,沒(méi)有把它們納入到圖像處理與分析中來(lái)。同樣,這里面也有一些也可以劃歸到計(jì)算機(jī)視覺(jué)中去。這都不重要,只要知道有這么個(gè)方法,能為自己所用,或者從中得到靈感,這就夠了。
本章的下載地址在:
http://iask.sina.com.cn/u/2252291285/ish?folderid=868771
1. Bilateral Filter
Bilateral Filter俗稱雙邊濾波器是一種簡(jiǎn)單實(shí)用的具有保持邊緣作用的平緩濾波器,由Tomasi等在1998年提出。它現(xiàn)在已經(jīng)發(fā)揮著重大作用,尤其是在HDR領(lǐng)域。
[1998 ICCV] BilateralFiltering for Gray and Color Images
[2008 TIP] AdaptiveBilateral Filter for Sharpness Enhancement and Noise Removal
2. Color
如果對(duì)顏色的形成有一定的了解,能比較深刻的理解一些算法。這方面推薦岡薩雷斯的數(shù)字圖像處理中的相關(guān)章節(jié)以及Sharma在Digital Color Imaging Handbook中的第一章“Colorfundamentals for digital imaging”。跟顏色相關(guān)的知識(shí)包括Gamma,顏色空間轉(zhuǎn)換,顏色索引以及膚色模型等,這其中也包括著名的EMD。
[1991 IJCV] Color Indexing
[2000 IJCV] The EarthMover's Distance as a Metric for Image Retrieval
[2001 PAMI] Colorinvariance
[2002 IJCV] StatisticalColor Models with Application to Skin Detection
[2003] A review of RGBcolor spaces
[2007 PR]A survey ofskin-color modeling and detection methods
Gamma.pdf
GammaFAQ.pdf
3.Compression and Encoding
個(gè)人以為圖像壓縮編碼并不是當(dāng)前很熱的一個(gè)話題,原因前面已經(jīng)提到過(guò)。這里可以看看一篇對(duì)編碼方面的展望文章
[2005 IEEE] Trends andperspectives in image and video coding
4.Contrast Enhancement
對(duì)比度增強(qiáng)一直是圖像處理中的一個(gè)恒久話題,一般來(lái)說(shuō)都是基于直方圖的,比如直方圖均衡化。岡薩雷斯的書(shū)里面對(duì)這個(gè)話題講的比較透徹。這里推薦幾篇個(gè)人認(rèn)為不錯(cuò)的文章。
[2002 IJCV] Vision and theAtmosphere
[2003 TIP] Gray and colorimage contrast enhancement by the curvelet transform
[2006 TIP] Gray-levelgrouping (GLG) an automatic method for optimized image contrastenhancement-part II
[2006 TIP] Gray-levelgrouping (GLG) an automatic method for optimized image contrastEnhancement-part I
[2007 TIP] TransformCoefficient Histogram-Based Image Enhancement Algorithms Using Contrast Entropy
[2009 TIP] A HistogramModification Framework and Its Application for Image Contrast Enhancement
5. Deblur (Restoration)
圖像恢復(fù)或者圖像去模糊一直是一個(gè)非常難的問(wèn)題,尤其是盲圖像恢復(fù)。港中文的jiaya jia老師在這方面做的不錯(cuò),他在主頁(yè)也給出了exe。這方面的內(nèi)容也建議看岡薩雷斯的書(shū)。這里列出了幾篇口碑比較好的文獻(xiàn),包括古老的Richardson-Lucy方法,幾篇盲圖像恢復(fù)的綜述以及最近的幾篇文章,尤以Fergus和Jiaya Jia的為經(jīng)典。
[1972] Bayesian-BasedIterative Method of Image Restoration
[1974] an iterative techniquefor the rectification of observed distributions
[1990 IEEE] Iterativemethods for image deblurring
[1996 SPM] Blind ImageDeconvolution
[1997 SPM] Digital imagerestoration
[2005] Digital ImageReconstruction - Deblurring and Denoising
[2006 Siggraph] RemovingCamera Shake from a Single Photograph
[2008 Siggraph]High-quality Motion Deblurring from a Single Image
[2011 PAMI]Richardson-Lucy Deblurring for Scenes under a Projective Motion Path
6. Dehazing and Defog
嚴(yán)格來(lái)說(shuō)去霧化也算是圖像對(duì)比度增強(qiáng)的一種。這方面最近比較好的工作就是He kaiming等提出的Dark Channel方法。這篇論文也獲得了2009的CVPR 最佳論文獎(jiǎng)。2003年的廣東高考狀元已經(jīng)于2011年從港中文博士畢業(yè)加入MSRA(估計(jì)當(dāng)時(shí)也就二十五六歲吧),相當(dāng)了不起。
[2008 Siggraph] SingleImage Dehazing
[2009 CVPR] Single ImageHaze Removal Using Dark Channel Prior
[2011 PAMI] Single ImageHaze Removal Using Dark Channel Prior
7. Denoising
圖像去噪也是圖像處理中的一個(gè)經(jīng)典問(wèn)題,在數(shù)碼攝影中尤其重要。主要的方法有基于小波的方法和基于偏微分方程的方法。
[1992 SIAM] Imageselective smoothing and edge detection by nonlinear diffusion. II
[1992 SIAM] Imageselective smoothing and edge detection by nonlinear diffusion
[1992] Nonlinear totalvariation based noise removal algorithms
[1994 SIAM] Signal andimage restoration using shock filters and anisotropic diffusion
[1995 TIT] De-noising bysoft-thresholding
[1998 TIP] Orientationdiffusions
[2000 TIP] Adaptivewavelet thresholding for image denoising and compression
[2000 TIP] Fourth-orderpartial differential equations for noise removal
[2001] Denoising? through wavelet shrinkage
[2002 TIP] The CurveletTransform for Image Denoising
[2003 TIP] Noise removalusing fourth-order partial differential equation with applications to medicalmagnetic resonance images in space and time
[2008 PAMI] AutomaticEstimation and Removal of Noise from a Single Image
[2009 TIP] Is DenoisingDead
8. Edge Detection
邊緣檢測(cè)也是圖像處理中的一個(gè)基本任務(wù)。傳統(tǒng)的邊緣檢測(cè)方法有基于梯度算子,尤其是Sobel算子,以及經(jīng)典的Canny邊緣檢測(cè)。到現(xiàn)在,Canny邊緣檢測(cè)及其思想仍在廣泛使用。關(guān)于Canny算法的具體細(xì)節(jié)可以在Sonka的書(shū)以及canny自己的論文中找到,網(wǎng)上也可以搜到。最快最直接的方法就是看OpenCV的源代碼,非常好懂。在邊緣檢測(cè)方面,Berkeley的大牛J Malik和他的學(xué)生在2004年的PAMI提出的方法效果非常好,當(dāng)然也比較復(fù)雜。在復(fù)雜度要求不高的情況下,還是值得一試的。MIT的Bill Freeman早期的代表作Steerable Filter在邊緣檢測(cè)方面效果也非常好,并且便于實(shí)現(xiàn)。這里給出了幾篇比較好的文獻(xiàn),包括一篇最新的綜述。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺(jué)中任何方向都無(wú)法逃避的一個(gè)問(wèn)題,這方面研究多深都不為過(guò)。
[1980] theory of edgedetection
[1983 Canny Thesis] findedge
[1986 PAMI] AComputational Approach to Edge Detection
[1990 PAMI] Scale-spaceand edge detection using anisotropic diffusion
[1991 PAMI] The design anduse of steerable filters
[1995 PR] Multiresolutionedge detection techniques
[1996 TIP] Optimal edgedetection in two-dimensional images
[1998 PAMI] Local ScaleControl for Edge Detection and Blur Estimation
[2003 PAMI] Statisticaledge detection_ learning and evaluating edge cues
[2004 IEEE] Edge DetectionRevisited
[2004 PAMI] Design ofsteerable filters for feature detection using canny-like criteria
[2004 PAMI] Learning toDetect Natural Image Boundaries Using Local Brightness, Color, and Texture Cues
[2011 IVC] Edge and lineoriented contour detection State of the art
9. Graph Cut
基于圖割的圖像分割算法。在這方面沒(méi)有研究,僅僅列出幾篇引用比較高的文獻(xiàn)。這里又見(jiàn)J Malik,當(dāng)然還有華人杰出學(xué)者Jianbo Shi,他的主頁(yè)非常搞笑,在醒目的位置標(biāo)注Do not flyChina Eastern Airlines ...?看來(lái)是被坑過(guò),而且坑的比較厲害。這個(gè)領(lǐng)域,俄羅斯人比較厲害。
[2000 PAMI] Normalizedcuts and image segmentation
[2001 PAMI] Fastapproximate energy minimization via graph cuts
[2004 PAMI] What energyfunctions can be minimized via graph cuts
10.Hough Transform
雖然霍夫變換可以擴(kuò)展到廣義霍夫變換,但最常用的還是檢測(cè)圓和直線。這方面同樣推薦看OpenCV的源代碼,一目了然。Matas在2000年提出的PPHT已經(jīng)集成到OpenCV中去了。
[1986 CVGIU] A Survey ofthe Hough Transform
[1989] A Comparative studyof Hough transform methods for circle finding
[1992 PAMI] Shapesrecognition using the straight line Hough transform_ theory and generalization
[1997 PR] Extraction ofline features in a noisy image
[2000 CVIU] RobustDetection of Lines Using the Progressive Probabilistic Hough Transform
11. Image Interpolation
圖像插值,偶爾也用得上。一般來(lái)說(shuō),雙三次也就夠了
[2000 TMI] Interpolationrevisited
12. Image Matting
也就是最近,我才知道這個(gè)詞翻譯成中文是摳圖,比較難聽(tīng),不知道是誰(shuí)開(kāi)始這么翻譯的。沒(méi)有研究,請(qǐng)看文章以及Richard Szeliski的相關(guān)章節(jié)。以色列美女Levin在這方面有兩篇PAMI。
[2008 Fnd] Image and VideoMatting A Survey
[2008 PAMI] A Closed-FormSolution to Natural Image Matting
[2008 PAMI] SpectralMatting
13.? Image Modeling
圖像的統(tǒng)計(jì)模型。這方面有一本專門的著作Natural Image Statistics
[1994] The statistics ofnatural images
[2003 JMIV] On Advances inStatistical Modeling of Natural Images
[2009 IJCV] Fields ofExperts
[2009 PAMI] Modelingmultiscale subbands of photographic images with fields of Gaussian scalemixtures
14. Image Quality Assessment
在圖像質(zhì)量評(píng)價(jià)方面,Bovik是首屈一指的。這位老師也很有意思,作為編輯出版了很多書(shū)。他也是IEEE的Fellow
[2004 TIP] Image qualityassessment from error visibility to structural similarity
[2011 TIP] blind imagequality assessment From Natural Scene Statistics to Perceptual Quality
15.? Image Registration
圖像配準(zhǔn)最早的應(yīng)用在醫(yī)學(xué)圖像上,在圖像融合之前需要對(duì)圖像進(jìn)行配準(zhǔn)。在現(xiàn)在的計(jì)算機(jī)視覺(jué)中,配準(zhǔn)也是一個(gè)需要理解的概念,比如跟蹤,拼接等。在KLT中,也會(huì)涉及到配準(zhǔn)。這里主要是綜述文獻(xiàn)。
[1992 MIA] Image matching asa diffusion process
[1992 PAMI] A Method forRegistration of 3-D shapes
[1992] a survey of imageregistration techniques
[1998 MIA] A survey ofmedical image registration
[2003 IVC] Imageregistration methods a survey
[2003 TMI]Mutual-Information-Based Registration of Medical Survey
[2011 TIP] Hairisregistration
16. Image Retrieval
圖像檢索曾經(jīng)很熱,在2000年之后似乎消停了一段時(shí)間。最近各種圖像的不變性特征提出來(lái)之后,再加上互聯(lián)網(wǎng)搜索的商業(yè)需求,這個(gè)方向似乎又要火起來(lái)了,尤其是在工業(yè)界。這仍然是一個(gè)非常值得關(guān)注的方面。而且圖像檢索與目標(biāo)識(shí)別具有相通之處,比如特征提取和特征降維。這方面的文章值得一讀。在最后給出了兩篇Book chapter,其中一篇還是中文的。
[2000 PAMI] Content-basedimage retrieval at the end of the early years
[2000 TIP] PicToSeekCombining Color and Shape Invariant Features for Image Retrieval
[2002] Content-Based ImageRetrieval Systems A Survey
[2008] Content-Based ImageRetrieval-Literature Survey
[2010] Plant ImageRetrieval Using Color,Shape and Texture Features
[2012 PAMI] A MultimediaRetrieval Framework Based on Semi-Supervised Ranking and Relevance Feedback
CBIR Chinese
fundament of cbir
17. Image Segmentation
圖像分割,非常基本但又非常難的一個(gè)問(wèn)題。建議看Sonka和岡薩雷斯的書(shū)。這里給出幾篇比較好的文章,再次看到了J Malik。他們給出了源代碼和測(cè)試集,有興趣的話可以試試。
[2004 IJCV] EfficientGraph-Based Image Segmentation
[2008 CVIU] Imagesegmentation evaluation A survey of unsupervised methods
[2011 PAMI] ContourDetection and Hierarchical Image Segmentation
18. Level Set
大名鼎鼎的水平集,解決了Snake固有的缺點(diǎn)。Level set的兩位提出者Sethian和Osher最后反目,實(shí)在讓人遺憾。個(gè)人以為,這種方法除了迭代比較費(fèi)時(shí),在真實(shí)場(chǎng)景中的表現(xiàn)讓人生疑。不過(guò),2008年ECCV上的PWP方法在結(jié)果上很吸引人。在重初始化方面,Chunming Li給出了比較好的解決方案
[1995 PAMI] Shape modelingwith front propagation_ a level set approach
[2001 JCP] Level SetMethods_ An Overview and Some Recent Results
[2005 CVIU] Geodesicactive regions and level set methods for motion estimation and tracking
[2007 IJCV] A Review ofStatistical Approaches to Level Set Segmentation
[2008 ECCV] RobustReal-Time Visual Tracking using Pixel-Wise Posteriors
[2010 TIP] DistanceRegularized Level Set Evolution and its Application to Image Segmentation
19.Pyramid
其實(shí)小波變換就是一種金字塔分解算法,而且具有無(wú)失真重構(gòu)和非冗余的優(yōu)點(diǎn)。Adelson在1983年提出的Pyramid優(yōu)點(diǎn)是比較簡(jiǎn)單,實(shí)現(xiàn)起來(lái)比較方便。
[1983] The LaplacianPyramid as a Compact Image Code
20. Radon Transform
Radon變換也是一種很重要的變換,它構(gòu)成了圖像重建的基礎(chǔ)。關(guān)于圖像重建和radon變換,可以參考章毓晉老師的書(shū),講的比較清楚。
[1993 PAMI] Imagerepresentation via a finite Radon transform
[1993 TIP] The fastdiscrete radon transform I theory
[2007 IVC] Generalisedfinite radon transform for N×N images
21.Scale Space
尺度空間濾波在現(xiàn)代不變特征中是一個(gè)非常重要的概念,有人說(shuō)SIFT的提出者Lowe是不變特征之父,而Linderburg是不變特征之母。雖然尺度空間濾波是Witkin最早提出的,但其理論體系的完善和應(yīng)用還是Linderburg的功勞。其在1998年IJCV上的兩篇文章值得一讀,不管是特征提取方面還是邊緣檢測(cè)方面。
[1987] Scale-spacefiltering
[1990 PAMI] Scale-Spacefor Discrete Signals
[1994] Scale-space theoryA basic tool for analysing structures at different scales
[1998 IJCV] Edge Detectionand Ridge Detection with Automatic Scale Selection
[1998 IJCV] FeatureDetection with Automatic Scale Selection
22. Snake
活動(dòng)輪廓模型,改變了傳統(tǒng)的圖像分割的方法,用能量收縮的方法得到一個(gè)統(tǒng)計(jì)意義上的能量最小(最大)的邊緣。
[1987 IJCV] Snakes ActiveContour Models
[1996 ] deformable modelin medical image A Survey
[1997 IJCV] geodesicactive contour
[1998 TIP] Snakes, shapes,and gradient vector flow
[2000 PAMI] Geodesic activecontours and level sets for the detection and tracking of moving objects
[2001 TIP] Active contourswithout edges
23.? Super Resolution
超分辨率分析。對(duì)這個(gè)方向沒(méi)有研究,簡(jiǎn)單列幾篇文章。其中Yang Jianchao的那篇在IEEE上的下載率一直居高不下。
[2002] Example-BasedSuper-Resolution
[2003 SPM] Super-Resolution Image Reconstruction A Technical Overview
[2009 ICCV] Super-Resolutionfrom a Single Image
[2010 TIP] ImageSuper-Resolution Via Sparse Representation
24. Thresholding
閾值分割是一種簡(jiǎn)單有效的圖像分割算法。這個(gè)topic在岡薩雷斯的書(shū)里面講的比較多。這里列出OTSU的原始文章以及一篇不錯(cuò)的綜述。
[1979 IEEE] OTSU Athreshold selection method from gray-level histograms
[2001 JISE] A Fast Algorithmfor Multilevel Thresholding
[2004 JEI] Survey overimage thresholding techniques and quantitative performance evaluation
25. Watershed
分水嶺算法是一種非常有效的圖像分割算法,它克服了傳統(tǒng)的閾值分割方法的缺點(diǎn),尤其是Marker-Controlled Watershed,值得關(guān)注。Watershed在岡薩雷斯的書(shū)里面講的比較詳細(xì)。
[1991 PAMI] Watersheds indigital spaces an efficient algorithm based on immersion simulations
[2001]The WatershedTransform Definitions, Algorithms and Parallelizat on Strategies
總結(jié)
以上是生活随笔為你收集整理的图像处理与计算机视觉:基础,经典以及最近发展(4)图像处理与分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 图像处理与计算机视觉:基础,经典以及最近
- 下一篇: 图像处理与计算机视觉:基础,经典以及最近