数字图像处理概述
圖像處理的兩個重要應(yīng)用領(lǐng)域:(1)改善圖像信息以便于人類理解 ?(2)為了方便存儲、傳輸和表示而對圖像進行處理,從而達到便于及其自動識別的目的。
?
什么是圖像處理
?
簡單來說,一幅圖像可以認為就是一個二維函數(shù)f(x,y),x,y表示位置,函數(shù)值就表示該位置處的圖像的灰度值或者是強度。當,x,y , f 都是離散值的時候,我們將該圖像稱為數(shù)字圖像,也就是說灰度值是由有限數(shù)量的組成的,每個灰度值都有其特定的位置和幅值。數(shù)字圖像處理就是指我們使用計算機來處理這些數(shù)字圖像。
?
圖像處理具體止步于哪些領(lǐng)域或者其他相關(guān)領(lǐng)域(比如圖像分析或者是計算機視覺)從哪里開始,并沒有一致的看法。有時,用輸入和輸出都是圖像這一規(guī)范來對數(shù)字圖像處理的范圍進行界定。這是人為的認定,其實并不準確,比如,在這種定義下,連求一幅圖像的平均值(輸出是一個數(shù))都不能算是圖像處理的范圍。
計算機視覺的目標是使用計算機來模擬人的視覺,包括理解并且根據(jù)輸入采取行動。圖像分析領(lǐng)域則是處在圖像處理和計算機視覺之間。
從圖像處理到計算機視覺這個連續(xù)的統(tǒng)一體并沒有明確的界限。一種有用的做法是在這個連續(xù)的統(tǒng)一體中考慮三種典型的計算處理,即低級、中級、高級處理。低級處理涉及一些基本操作,比如圖像降噪,對比度增強,圖像銳化等,低級處理輸入和輸出都是圖像為特征。中級處理涉及的范圍比較廣,如對圖像進行分割(將圖像不同的區(qū)域或者目標分離),而后對不同的目標進行分類,中級處理是以圖像作為輸入,但是輸出是從這些圖像中提取到不同特征,比如圖像的輪廓信息,各個物體的標識。而高級圖像處理涉及到“理解”圖像上的內(nèi)容,形成一些認知功能。
?
本書中,將數(shù)字圖像處理的范圍界定為,輸入和輸出都是圖像的處理,也包括從圖像中提取特征的處理,也包括圖像中各個目標的識別。
?
數(shù)字圖像處理的起源
?
數(shù)字圖像最早的應(yīng)用是在報紙行業(yè),圖像第一次通過海底電纜從倫敦傳到紐約。這種傳輸方法需要使用特殊的設(shè)備對圖像進行編碼,然后接收端對圖像進行解碼。
早期的圖像使用5個不同的灰度級來編碼圖像 ??????????????????使用15個灰度級
以上的例子涉及數(shù)字圖像,但是并不涉及數(shù)字圖像的處理,因為創(chuàng)建這些圖像時,并沒有涉及計算。數(shù)字圖像處理的歷史與計算機的發(fā)展高度相關(guān)。因為數(shù)字圖像要求非常大的存儲和計算能力,因此數(shù)字圖像處理領(lǐng)域的發(fā)展必須依靠數(shù)字計算機及數(shù)據(jù)存儲、顯示、和傳輸?shù)认嚓P(guān)支撐技術(shù)的發(fā)展。
?
第一臺足以強大到足以執(zhí)行有意義的圖像處理任務(wù)的大型計算機出現(xiàn)在20世界60年代,使用計算機技術(shù)改善空間探測器發(fā)回的圖像,以校正航天器上電視攝像機中各種類型的圖像畸變。此后,圖像處理領(lǐng)域蓬勃發(fā)展,除了醫(yī)學(xué)和空間項目外,計算法方法用于增強對比度或?qū)⒒叶染幋a為彩色,以便于解釋工業(yè)、醫(yī)學(xué)及生物科學(xué)等領(lǐng)域中的X射線和其他圖像。圖像復(fù)原用于處理不可修復(fù)物體的退化圖像,比如在考古領(lǐng)域,使用圖像處理方法成功復(fù)原模糊的圖像。其他更多領(lǐng)域不舉例了。
上面的這些例子說明圖像處理的結(jié)果是便于人類理解。數(shù)字圖像處理的第二個主要應(yīng)用領(lǐng)域是解決機器感知問題。在這種情況下,是為了更加適合于計算機處理的形式從圖中提取信息的過程,這種信息類似于人類用于解釋一幅圖像內(nèi)容的視覺特性。比如說,機器感知中,使用的信息類型通常有統(tǒng)計矩、傅里葉變換系數(shù)和多維距離度量。
?
數(shù)字圖像處理的基本步驟
圖像獲取: 這個階段通常還包括圖像的預(yù)處理,比如圖像的縮放。
?
圖像增強: 對圖像進行某種操作,使得其結(jié)果在特定應(yīng)用中比原來的圖像更合適,注意增強技術(shù)是建立在面向特定問題的基礎(chǔ)上的。不同類型的圖像,使用的增強方法不同,比如用于增強X射線得到的圖像的方法就不適合于用來增強紅外線獲取到的衛(wèi)星圖像。圖像的增強是一個主觀的任務(wù),觀察者就是特殊方法工作的好壞的最終裁判者。
?
圖像復(fù)原: 是改善圖像外觀的處理領(lǐng)域,與圖像增強不同,圖像增強是主觀的,但是圖像復(fù)原是客觀的,復(fù)原的技術(shù)傾向于以圖像退化的數(shù)學(xué)或者是概率模型為基礎(chǔ)。
?
彩色圖像處理:彩色圖像處理已經(jīng)成為一個重要領(lǐng)域,因為互聯(lián)網(wǎng)上圖像的使用不斷增長。
?
小波與多分辨率處理:小波是以不同分辨率來描述圖像的基礎(chǔ)。特別是圖像的壓縮和金字塔表示中使用了小波,此時,圖像被成功地細分為較小的區(qū)域。大多數(shù)計算機用戶都熟悉圖像壓縮所使用的圖像文件擴展名,比如,JPEG圖像壓縮標準。
?
形態(tài)學(xué)處理:涉及提取提取圖像分量的工具,這些分量在表示和描述形狀方面都很有用。這也是從輸出圖像處理到輸出圖像屬性轉(zhuǎn)化的開始。
?
圖像分割: 將一幅圖像劃分為它的組成部分或者是目標。自動分割是數(shù)字圖像處理中最困難的任務(wù)之一。很弱且不穩(wěn)定的圖像分割算法幾乎總是導(dǎo)致最終失敗。通常,分割越準確,識別越成功。
?
圖像表示和描述: 這個階段幾乎總是在分割階段的輸出之后,通常分割的輸出是未加工的像素數(shù)據(jù),這寫數(shù)據(jù)要么是構(gòu)成一個區(qū)域的邊界,要么是構(gòu)成該區(qū)域的所有的點。首先,必須確定數(shù)據(jù)是應(yīng)該表示成一條邊界還是表示成一個區(qū)域。如果關(guān)注的是外部形狀特征,比如說是角點和拐點,那么表示為邊界是合適的。如果關(guān)注的是內(nèi)部的特征,那么,比如紋理和骨架,那么表示為區(qū)域是比較合適的。這些表示都是解決把原始數(shù)據(jù)轉(zhuǎn)化成適合計算機進行后續(xù)處理的形式的一部分。描述又稱為特征許三責,涉及提取特征,它可得到某些感興趣的定量信息,是區(qū)分一組目標與另一組目標的基礎(chǔ)。
目標識別:基于目標的描述給目標賦予特定的標識的過程。
?
?
?
總結(jié)
- 上一篇: 数学逻辑习题集(1)
- 下一篇: 机器人学导论概括