数字图像处理(2)——数字图像获取
文章目錄
- 2.1圖像數字化
- 2.1.1數字圖像的表示
- 2.1.1.1黑白圖像
- 2.1.1.2灰度圖像
- 2.1.1.3彩色圖像
- 2.1.2圖像數字化過程
- 2.1.2.1采樣
- 2.1.2.2量化
- 2.1.2.3采樣、量化參數與數字化圖像間的關系
- 2.1.2.4圖像數字化設備
- 2.2圖像灰度直方圖
- 2.3圖像處理算法的形式
- 2.3.1基本功能形式
- 2.3.2幾種具體算法形式
- 2.3.2.1局部處理
- 2.3.2.2點處理:
- 2.3.2.3大局處理
- 2.3.2.4迭代處理
- 2.3.2.5跟蹤處理
- 2.3.2.6窗口處理和模板處理
- 2.3.2.7串行處理和并行處理
- 2.4圖像的數據結構與特征
- 2.4.1圖像的數據結構
- 2.4.1.1組合方式
- 2.4.1.2比特面方式
- 2.4.1.3分層結構
- 2.4.1.4樹結構
- 2.4.1.5多重圖像數據結構
- 2.4.2圖像文件格式
- 2.4.2.1 RAW格式
- 2.4.2.2 BMP格式
- 2.4.2.3 GIF格式
- 2.4.2.4 TIFF格式
- 2.4.3圖像的特征與噪聲
- 2.4.3.1圖像的特征類別
- 2.4.3.2特征提取與特征空間
- 2.4.3.2.1特征提取
- 2.4.3.2.2特征空間
- 2.4.4圖像噪聲
2.1圖像數字化
- 原理:圖像數字化是將一幅畫面轉換成計算機能處理的形式–數字圖像的過程.
- 包括采樣和量化兩個過程.
2.1.1數字圖像的表示
- 數字圖像用矩陣來描述:以一幅數字圖像F左上角像素中心為坐標原點,一幅m*n的數字圖像用矩陣表示為:
數字圖像根據灰度級的差異可以分為:黑白圖像,灰度圖像和彩色圖像.
2.1.1.1黑白圖像
- 圖像的每個像素只能是黑或者白,沒有中間的過渡,因此又稱為二值圖像.二值圖像的像素值為1或0.
2.1.1.2灰度圖像
- 每個像素的信息由一個量化的灰度來描述圖像,沒有彩色信息,字節(8位)可表示256級灰度[0,255]
2.1.1.3彩色圖像
- 彩色圖像是指每個像素由R G B分量構成的圖像,其中R G B是由不同的灰度級來描述,1個灰度級使用一個字節,3字節可以表示一個像素.
2.1.2圖像數字化過程
2.1.2.1采樣
-
采樣:將空間上連續的圖像變換成離散點的操作成為采樣。
-
采樣的兩個參數:
-
采樣間隔
- 采樣點之間的距離。
- 采樣間隔需要符合信號與系統處理中的抽樣定理即在一定的采樣間隔之下,能夠完全把原始信號回復的一個原則。
-
采樣孔徑
- 采樣的形狀和大小
-
2.1.2.2量化
- 量化:
- 將像素灰度轉換成離散的整數值的過程。
- 一幅數字圖像中不同灰度值的個數成為灰度級,用G表示。一般數字圖像灰度級數G為2的整數冪,即G=2^g,g為量化bit數、若一幅圖像的量化灰度級G=256級,灰度值范圍為0-255,常稱為8bit量化。
- 圖像數據量:
- 一幅M*N,灰度級為G的圖像所需的存儲空間為M * N * g(bit)為圖像數據量。
2.1.2.3采樣、量化參數與數字化圖像間的關系
-
數字化方式可分為均勻采樣、量化和非均勻采樣、量化。
- 所謂均勻,指的是采樣、量化均為等間隔方式。圖像數字化一般采用均勻采樣和均勻量化方式。
-
非均勻采樣:根據圖像細節的豐富程度改變采樣間隔,細節豐富的地方,采樣間隔小,否則間距大。
-
非均勻量化:對圖像層次少的區域采用間隔大量化,而對圖像層次豐富的區域采用間隔小量化。
-
采樣關系:
- 采樣間隔大,所得圖像像素數越少,空間分辨率低,質量差
- 采樣間隔越小,所得圖像像素書越多,空間分辨率高,圖像質量好,但數據量大
- 下圖像素數從256 * 256遞減至8 * 8
-
量化關系:
-
量化等級越多,所得圖像層次越豐富,灰度分辨率越高,質量越好,但數據量大,量化等級越少,圖像層次欠豐富,灰度分辨率低,質量變差,會出現加輪廓現象,但是數據量小。
-
例子:下面圖像為采樣間距相同時灰度級數從256到64,16,8,4,2所得的圖像。
-
2.1.2.4圖像數字化設備
- 數字化器組成
-
掃描儀工作原理
-
圖像數字化器的性能評價:
2.2圖像灰度直方圖
- 圖像灰度直方圖的概念:灰度直方圖是反應一幅圖像中各灰度級像素出現的頻率與灰度級的關系,以灰度級為橫坐標,頻率為縱坐標,繪制頻率同灰度級的關系圖就是一幅灰度圖像的直方圖。
- 灰度直方圖的性質:
- 只能反映圖像的灰度分布情況,而不能反應圖像像素的位置,即其會丟失位置信息
- 一幅圖像對應唯一的灰度直方圖,反之不成立
- 一幅圖像分為多個區域,多個區域的直方圖之和為該圖像的直方圖
- 應用:
- 判斷圖像量化是否恰當
- 確定圖像二值化的閾值
2.3圖像處理算法的形式
2.3.1基本功能形式
- 單幅圖像->單幅圖像
- 多幅圖像->單幅圖像
- 單(或多)幅圖像->數字或符號等
2.3.2幾種具體算法形式
2.3.2.1局部處理
-
領域:
-
對于任一像素(i,j),該像素周圍的像素構成的集合{(i+p,j+q),p、q取合適的整數},叫做該像素的鄰域
-
常用的鄰域:下圖分別表示中心像素的4-鄰域、8-鄰域
-
-
局部處理的概念:
-
對輸入圖像IP(i,j)處理時,某一輸出像素JP(i,j)值由輸入圖像像素(i,j)及其鄰域N(IP(i,j))中的像素值確定。這種處理成為局部處理。
計算公式:
-
-
局部處理的例子
- 對一幅圖像采用3 * 3模板進行卷積運算
2.3.2.2點處理:
-
在局部處理中,當輸出值JP(i,j)僅與IP(i,j)有關,稱為點處理。
2.3.2.3大局處理
-
在局部處理中,輸出像素JP(i,j)的值取決于圖像大范圍或者全部像素的值,這種處理成為大局處理。
2.3.2.4迭代處理
-
反復對圖像進行某種運算直至滿足給定的條件,從而得到輸出圖像的處理形式稱為迭代處理。
-
圖像的細化處理過程:
2.3.2.5跟蹤處理
- 選擇滿足適當條件的像素作為起始像素,檢查輸入圖像和已得到的輸出結果,求出下一步應該處理的像素,進行規定的處理,然后決定時繼續處理下面的像素,還是終止處理。
- 特點:
- 目標像素依賴于前一個像素的位置和處理條件。
2.3.2.6窗口處理和模板處理
-
對圖像的處理,一般采用對整個畫面進行處理,但也有只對畫面中特定的部分進行處理的情況。這種處理方式的代表由窗口處理和模板處理。
-
單獨對圖像中選定的矩形區域內的像素進行處理的方式叫做窗口處理。
-
希望單獨處理任意形狀的區域時,可采用模板處理。
-
模板的概念:任意形狀的區域。
-
模板平面:一個和處理圖像相同大小的二維數組,用來存儲模板信息。一般是一幅二值圖像。
-
模板處理:邊參照模板平面對圖像進行某種操作。
-
若模板成矩形區域,則與窗口處理有相同的效果,但是窗口處理與模板處理不同之處是后者必須設置一個模板平面。
2.3.2.7串行處理和并行處理
- 串行處理:
- 后一像素輸出結果依賴于前面像素處理的結果,并且只能一次處理各像素而不能同時對各像素進行相同處理的一種處理形式。
- 特點:用輸入圖像的第(i,j)像素鄰域的像素值和輸出圖像(i,j)以前像素的處理結果計算輸出圖像(i,j)像素的值。處理算法要按照一定順序進行。
- 并行處理:
- 對圖像內的各像素同時進行相同形式運算的一種處理形式。
- 特點:輸出圖像像素(i,j)的值,只用輸入圖像像素進行運算。各輸出值可以獨立運算。
2.4圖像的數據結構與特征
- 圖像數據結構是指圖像像素灰度值的存儲方式,常用方式是將圖像各像素灰度值用一維或者二維數組相應的各元素加以存儲。其他方式
2.4.1圖像的數據結構
2.4.1.1組合方式
- 方法:一個字長存放多個像素灰度值。
- 特點:節省內存,但是計算量增加,處理程序復雜。
2.4.1.2比特面方式
-
將所有像素灰度的相同比特位用一個二維數組表示,形成比特面。n個比特位表示的灰度圖像按比特面方式存儲,就得到n個比特面。
-
特點:能充分利用內存空間,便于進行比特面之間的運算,但對灰度圖像處理耗時比較多。
2.4.1.3分層結構
-
從原始圖像開始依次構成像素數越來越少的系列圖像,使數據表示具有分層性。代表為錐形(金字塔)結構。
-
錐形結構:對2^k * 2^k 個像素形成的圖像,依次構成分辨率下降的k+1幅圖像的層次集合。
-
方法:從原圖像I0開始,依次產生行列像素數都變為1/2的一幅幅的圖像I1,I2,…,Ik。此時,作為像素Ii的各像素的值,就是它前一個圖像Ii-1的對應的2*2像素的灰度平均值。
-
優點:先對低分辨率圖像進行處理,然后根據需要對高分辨率圖像進行處理,可提高效率。
2.4.1.4樹結構
-
對于如圖所示的一幅二值圖像的行、列接連不斷地二等分,如果圖像被分割部分中的全體像素都變成具有相同的特征時,這一部分不再分割。
-
用此種方法,可以把圖像用樹結構(4叉樹)來表示。這可以用在特征提取和信息壓縮等方面。
2.4.1.5多重圖像數據結構
- 對于彩色圖像或者多波段圖像而言,每個像素包含著多個波段的信息。
- 存儲方式有三種:
- 逐波段存儲,分波段處理時采用
- 逐行存儲,逐行掃描記錄設備采用
- 逐像素存儲,用于分類
2.4.2圖像文件格式
- 按不同的方式進行組織或者存儲數字圖像像素的灰度,就得到不同格式的像素文件,圖像文件按照其格式的不同具有相應的擴展名。
- 常見的圖像文件格式按照擴展名分為:RAW格式、BMP格式、TGA格式、PCX格式、GIF格式、TIFF格式等。
- 上述圖像格式大致包含下列特征:
- 描述圖像的高度、寬度以及各種物理特征的數據
- 彩色定義
- 描述圖像的位圖數據體
2.4.2.1 RAW格式
- 將像素按照行列號順粗存儲在文件中,這種文件只含有圖像像素數據,不含有信息頭,因此,在讀圖像時,需要事先知道圖像大小(矩陣大小),它是最簡單的一種圖像文件格式。
2.4.2.2 BMP格式
-
由以下四個部分組成:
- 14字節的文件頭
- 40字節的信息頭
- 8字節的顏色定義
- 位圖數據
-
位圖文件頭:BITMAPFILEHEADER
-
位圖信息頭:
-
palette(調色板)
-
調色板實際上是一個數組,數組中每個元素的類型為RGBQUAD結構,占4個字節。
-
結構定義如下:
-
有些位圖,比如真彩色圖,沒有調色板,他們的位圖信息頭后直接是位圖數據。
-
-
位圖數據:
- 分為兩種情況:
- 對于用到調色板的位圖,圖像數據就是該像素顏色在調色板中的索引值
- 對于真彩色圖,圖像數據就是實際的R、G、B值。
- 對于2色位圖,用1位就可以表示該像素的顏色,因此一個字節可以表示8個像素。對于16色位圖,用4位可以標識一個像素的顏色,所以1個字節可以表示2個像素;對于256色位圖,一個字節剛好可以表示一個像素
- 對于真彩色圖,3個字節才能表示1個像素
- 分為兩種情況:
2.4.2.3 GIF格式
- GIF圖像是基于顏色列表的,最多支持8位。GIF支持在一幅GIF文件中存放多幅彩色圖像,并且可以按照一定的順序和時間間隔將多幅圖像依次讀出并且顯示在屏幕上,這樣就可以形成一種簡單的動畫效果。
- GIF一般由7個數據區組成:頭文件、通用調色板、位圖數據區以及四個擴充區。
2.4.2.4 TIFF格式
- 文件主要由三個部分組成:
- 文件頭
- 標識信息區
- 圖像數據區
- TIFF文件有其特有的標識信息,并能進行自定義,是一種開放易于擴展的數據格式,能支持較大數據量和不同定義方式的影像數據,廣泛應用于遙感、地理信息領域。
2.4.3圖像的特征與噪聲
2.4.3.1圖像的特征類別
- 光譜特征
- 幾何特征
- 時相特征
- 直方圖特征
- 灰度邊緣特征
- 線、角點、紋理特征
- 點特征:僅由各個像素就能決定的性質。如單色圖像中的灰度值、彩色圖像中的R G B成分的值。
- 局部特征:在小鄰域內所具有的特征,如線和邊緣的強度、方向、密度和統計量(平均值、方差等)等。
- 區域特征:在圖像內的對象物(一般是指與該區域外部有區別的具有一定性質的區域)內的點或者局部的特征分布,或者統計量,以及區域的幾何特征(面積、形狀)等。
- 整體特征:整個圖像作為一個區域看待時的統計性質和結構特征等。
2.4.3.2特征提取與特征空間
2.4.3.2.1特征提取
- 獲取圖像特征信息的操作稱作特征提取。
- 它作為模式識別、圖像理解或者信息量壓縮的基礎是很重要的。通過特征提取,可以獲得特征構成的圖像(稱作特征圖像)和特征參數。
2.4.3.2.2特征空間
- 把從圖像提取的m個特征量y1,y2,…ym,用m維的向量Y = [y1 y2 ym]^t表示稱為特征向量。另外,對應于各特征量的m維空間叫做特征空間。
2.4.4圖像噪聲
- 外部噪聲:如天體放電干擾等
- 內部噪聲:系統內部產生,主要包括四種:由光和電的基本性質引起,機械運動產生的噪聲、元器件噪聲、系統內部電路噪聲等。
- 對灰度圖像f(x,y)來說,可看作二維亮度分布,而噪聲可看作對亮度的干擾,用n(x,y)表示,常用統計特征來描述噪聲,如均值、方差(交流功率)、總功率等。
- 按照噪聲對圖像的影響可分為加性噪聲模型和乘性噪聲模型兩大類。設f(x,y)為理想圖像,n(x,y)為噪聲,實際輸出圖像為g(x,y)
- 加性噪聲,與圖像光強大小無關,g(x,y)=f(x,y)+n(x,y)
- 乘性噪聲,與圖像光強大小相關,隨亮度大小變化而變化,g(x,y)=f(x,y)[1+n(x,y)]
- 光電管噪聲
- 攝像管噪聲
- 前置放大器噪聲
- 光學噪聲
總結
以上是生活随笔為你收集整理的数字图像处理(2)——数字图像获取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: js ajax上传file文件上传,使用
- 下一篇: 人工智能 一种现代方法 第2章 智能化智