冈萨雷斯《数字图像处理》学习笔记(八)图像压缩
目錄
?
一、圖像壓縮基本概念
1、圖像壓縮的可能性
2、圖像壓縮的可能性
二、圖像壓縮模型
三、信息論要素
四、無損壓縮和有損壓縮
五、有損壓縮
1、有損預(yù)測編碼
(1)有損壓縮的基本概念
(2)量化器
(3)量化器的定義
(4)無損到有損——算法演變
2、變換編碼
六、圖像視頻壓縮標(biāo)準(zhǔn)
1、圖像壓縮標(biāo)準(zhǔn)
2、JPEG標(biāo)準(zhǔn)的劃分
3、JPEG2000壓縮標(biāo)準(zhǔn)(ISO 15444)
4、視頻壓縮
5、視頻編解碼標(biāo)準(zhǔn)
6、264/AVC標(biāo)準(zhǔn)
7、H.264實(shí)現(xiàn)的目標(biāo)
8、視頻編解碼技術(shù)的下一步發(fā)展趨勢探討
一、圖像壓縮基本概念
為什么要進(jìn)行圖像壓縮?
舉個(gè)栗子:?一部90分 鐘的彩色電影,每秒放映24幀。把它數(shù)字化,每幀512x512象素, 每象素的R、G、B三分量分別占8 bit,總比特?cái)?shù)為:90*60*24*3*512*512*8bit=97200MB=95GB.
如一張CD光盤可存600兆字節(jié)數(shù)據(jù),這部電影圖像(不包括聲音)就需要160張CD光盤用來存儲。
1、圖像壓縮的可能性
圖像作為信源有很大的冗余度,通過編碼的方法減少或去掉這些冗余信息后可以有效壓縮圖像,同時(shí)又不會損害圖像的有效信息。數(shù)據(jù)是用來表示信息的。如果不同的方法為表示等量的信息使用了不同的數(shù)據(jù)量,那么使用較多數(shù)據(jù)量的方法中,有些數(shù)據(jù)必然是代表了無用的信息,或者是重復(fù)地表示了其它數(shù)據(jù)已表示的信息,這就是數(shù)據(jù)冗余的概念。
相對數(shù)據(jù)冗余
如果n1和n2代表兩個(gè)表示相同信息的數(shù)據(jù)集合中所攜載信息單元的數(shù)量,則n1表示的數(shù)據(jù)集合的相對數(shù)據(jù)冗余定義為:
其中為壓縮率
相對數(shù)據(jù)冗余和壓縮率的一些特例
2、圖像壓縮的可能性
■三種基本的數(shù)據(jù)冗余
編碼冗余
如果圖像中平均每個(gè)像素使用的比特?cái)?shù)大于該圖像的信息熵,則圖像中存在冗余。
像素冗余
? ◆反映圖像中像素之間的相互關(guān)系:空間冗余,幾何冗余,幀間冗余
? ◆因?yàn)槿魏谓o定像素的值可以根據(jù)與這個(gè)像素相鄰的像素進(jìn)行預(yù)測,所以單個(gè)像素?cái)y帶的信息相對較少
? ◆對于一幅圖像,很多單個(gè)像素對視覺的貢獻(xiàn)是冗余的。它的值可以通過與它相鄰的像素值為基礎(chǔ)進(jìn)行預(yù)測
? ? ? 如:原圖像數(shù)據(jù): 250 253 251 252 250; ----40bit。
? ? ? ? ? 壓縮后數(shù)據(jù): ?250? ?3? ? 1? ? ?2? ? ?0 ?---- ?14bit。
視覺心理冗余
●人眼感覺到的圖像區(qū)域亮度不僅取決于該區(qū)域的反射光,例如根據(jù)馬赫帶效應(yīng),在灰度值為常數(shù)的區(qū)域也能感覺到灰度值的變化
●這是由于眼睛對所有視覺信息感受的靈敏度不同。在正常視覺處理過程中各種信息的相對重要程度不同
●有些信息在通常的視覺過程中與另外一些信息相比并不那么重要,我們認(rèn)為這些信息是心理視覺冗余的,去除這些信息并不會明顯降低圖像質(zhì)量
?由于消除心理視覺冗余數(shù)據(jù)會導(dǎo)致一定量信息的丟失,所以這一-過程通常稱為量化
?心理視覺冗余壓縮是不可恢復(fù)的,量化的結(jié)果導(dǎo)致了數(shù)據(jù)有損壓縮。
■如果能減少或消除上述三種冗余的1種或多種冗余,就能取得數(shù)據(jù)壓縮的效果。
保真度準(zhǔn)則——評價(jià)壓縮算法的標(biāo)準(zhǔn)
a.客觀保真度準(zhǔn)則—定量描述
b.主觀保真度準(zhǔn)則—定性或定性基礎(chǔ)上的定量描述
?客觀保真度準(zhǔn)則
如果信息損失的程度,可以表示為原始或輸入圖像與壓縮后又解壓縮輸出的圖像的函數(shù),這個(gè)函數(shù)就被稱為客觀保真度準(zhǔn)則。
一般表示為:
e(x, y) = f '(x, y) ? f (x, y)
式中:f(x,y)是輸入圖像,f '(x, y)是壓縮后解壓縮的圖像, e(x,y)是誤差函數(shù)
由此可得兩個(gè)圖像之間的均方根誤差:
均方信噪比:
?主觀保真度準(zhǔn)則
通過視覺比較兩個(gè)圖像,給出一個(gè)定性的評價(jià),如很粗、粗、稍粗、相同、稍好、較好、很好,這種評價(jià)被稱為主觀保真度準(zhǔn)則
二、圖像壓縮模型
一個(gè)圖像壓縮系統(tǒng):編碼器和解碼器。
?編碼器由一個(gè)消除輸了冗余的信源編碼器和一個(gè)用于增強(qiáng)信源編碼輸出的噪聲抗擾性的信道編碼器構(gòu)成。
?解碼器由一個(gè)信源解碼器和一個(gè)信道解碼器構(gòu)成。
?
信源編碼器
減少或消除輸入圖像中的編碼冗余、像素間冗余及心理視覺冗余。
■轉(zhuǎn)換器:減少像素間冗余,
■量化器:減少心理視覺冗余,該步操作是不可逆的
■符號編碼器:減少編碼冗余
并不是每個(gè)圖像壓縮系統(tǒng)都必須包含這3種操作,如進(jìn)行無誤差壓縮時(shí),必須去掉量化器
信源解碼器
?
■符號解碼器:進(jìn)行符號編碼的逆操作
■反向轉(zhuǎn)換器:?進(jìn)行轉(zhuǎn)換器的逆操作
為什么沒有反向量化器??---量化過程導(dǎo)致了不可逆的信息損失
?
信道編碼器和信道解碼器
■信道編碼是解決可靠性問題,盡量使處理過的信
號在傳輸過程中不出錯(cuò)或少出錯(cuò),即使出錯(cuò)也要有能力盡量糾正錯(cuò)誤。
■漢明(Hamming)編碼:在編了碼的碼字后面增加足
夠的比特位以保證各個(gè)正確的碼字之間至少有一定數(shù)量的比特位不相同
?
三、信息論要素
信源的定義:信源指能夠產(chǎn)生信息的事物
如上圖。第一行是信源可能產(chǎn)生的信息,第二行是這些信息出現(xiàn)的概率
信息量:
熵:
編碼應(yīng)用中,熵表示信源中消息的平均信息量。在不考慮消息間的相關(guān)性時(shí),是無失真代碼平均長度比特?cái)?shù)的下限。
說明該信源編碼平均碼長最短情況下為7/4,不能再小,否則就會引起錯(cuò)誤。而平均碼長比此數(shù)大許多時(shí),就表明還有待改進(jìn)。
?
熵的性質(zhì):
(1)?熵是一個(gè)非負(fù)數(shù),即總有H(s)>=0。
(2)?當(dāng)其中一個(gè)符號sj的出現(xiàn)概率p(sj)=1時(shí),其余符號si(i≠j)的出現(xiàn)概率p(si)=0,H(s)=0。
(3)?當(dāng)各個(gè)si出現(xiàn)的概率相同時(shí),則最大平均信息量為logq。(此處對數(shù)以2為底)
(4)熵值總有H(s)<?logq。(此處對數(shù)以2為底)
?
無失真編碼定理
可以證明,在無干擾的條件下,存在一:種無失真的編碼方法,使編碼的平均長度L與信源的熵H(s)任意地接近,??即L=H(s)+ε。其中ε為任意小的正數(shù),但以H(s)為其下限即L≥H(s),這就是香農(nóng)(Shannon)無干擾編碼定理。
編碼效率:
壓縮比:
由香農(nóng)(Shannon)無干擾編碼定理,無失真編碼最大可能的數(shù)據(jù)壓縮比為:
熵與冗余度的關(guān)系
對于無失真圖像的編碼,原始圖像數(shù)據(jù)的壓縮存在一個(gè)下限,即平均碼組長度不能小于原始圖像的熵,而理論上的最佳編碼的平均碼長無限接近原始圖像的熵。
信息冗余度一“信息剩余度”。是指一定數(shù)量的信號單元可能有的最大信息量與其包含的實(shí)際信息量之差。通常用R表示。在通信系統(tǒng)中,信源編碼是降低信號中的信息冗余度的編碼,目的是提高通信系統(tǒng)的有效性;信道編碼是提高信息冗余度的編碼,目的是提高通信系統(tǒng)的可靠性
基本編碼定理
無噪聲編碼定理
噪聲編碼定理
信源編碼定理
四、無損壓縮和有損壓縮
?
無誤差壓縮的必要性
■??在醫(yī)療或商業(yè)文件的歸檔,有損壓縮因?yàn)榉稍蚨唤?br /> ■?衛(wèi)星成像的收集,考慮數(shù)據(jù)使用和所花費(fèi)用,不希望有任何數(shù)據(jù)損失
■X光拍片,信息的丟失會導(dǎo)致診斷的正確性無損壓縮的壓縮率一般為2-10
無誤差壓縮技術(shù)
■減少像素間冗余:建立一種可替代的圖像表達(dá)方式
減少編碼冗余:對這種表達(dá)方式進(jìn)行編碼
?
變長編碼
?霍夫曼(Huffman)編碼
?其它變長編碼
?算術(shù)編碼
LZW編碼
位平面編碼
無損預(yù)測編碼
霍夫曼編碼栗子:
幾種變長編碼:
五、有損壓縮
概述
■犧牲圖像復(fù)原的準(zhǔn)確度以換取壓縮能力的增加
■如果產(chǎn)生的失真可以容忍,則壓縮能力的增加是有效的
分類
■有損預(yù)測編碼
?直接對像素在圖像空間進(jìn)行操作,稱為空域方法
■變化編碼
?基于圖像變換的編碼方法,稱為變換域方法
1、有損預(yù)測編碼
(1)有損壓縮的基本概念
有損壓縮是:■通過犧牲圖像的準(zhǔn)確率來達(dá)到增大壓縮率的目的。
? ? ? ? ? ? ? ? ? ? ? ■如果容忍解壓后的結(jié)果中有一定的誤差,那么壓縮率可以顯著提高。
有損壓縮方法的壓縮比:■在圖像壓縮比大于30:1時(shí),仍然能夠重構(gòu)圖像。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?■在圖像壓縮比為10:1到20:1時(shí),重構(gòu)圖像與原圖幾乎沒有差別,且無損壓縮的壓縮比很少有能超過3:1的。
有損與無損壓縮的根本差別在于有沒有量化器模塊。
數(shù)據(jù)源編、解碼一般類型:
(2)量化器
■減少數(shù)據(jù)量的最簡單的辦法是將圖像量化成較少的灰度級,通過減少圖像的灰度級來實(shí)現(xiàn)圖像的壓縮;
■這種量化是不可逆的,因而解碼時(shí)圖像有損失。
例如:如果輸入是256個(gè)灰度級,對灰度級量化后輸出,只剩下4個(gè)層次,數(shù)據(jù)量被大大減少。
(3)量化器的定義
階梯形量化函數(shù)t=q(s),是一個(gè)s的奇函數(shù)(即q(-s)=-q(s)),它可以通過L/2、和來完全描述,從而定義了一個(gè)量化器。
■被稱為量化器的決策級(閾值)?;
■被稱為量化器的重構(gòu)級(代表級)。?
■L:??是量化器的級數(shù)。
由于習(xí)慣的原因,被認(rèn)為是映射到,如果它在半開區(qū)間(,?]
(4)無損到有損——算法演變
基本思想
對無損預(yù)測壓縮的誤差進(jìn)行量化,通過消除視覺心理冗余,達(dá)到對圖像進(jìn)一步壓縮的目的。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ——引入量化(Quantification)
解碼原理及過程
?
注意:上述方案的壓縮編碼中,預(yù)測器的輸入是fn,??而解壓中的預(yù)測器的輸入是fn',要使用相同的預(yù)測器,編碼方案要進(jìn)行修改。
修改后的有損預(yù)測編碼:
DPCM簡介
差分脈沖編碼調(diào)制(Differential Pulse CodeModulation, DPCM),采用反饋方法預(yù)測估值。
編碼原理圖:
2、變換編碼
編碼、解碼流程圖:
變換編碼基本原理
將FFT逆變換??????表達(dá)式進(jìn)行改寫:
變換編碼,即要用等式的右部近似原圖像。
進(jìn)一步改寫:
?
其中:
1)F是一個(gè)包含了f(x,y)的象素的n*n的矩陣;
2)的值只依賴坐標(biāo)變量x,y,u,v,與T(u,v)和f(x,y)?的值無關(guān)。被稱為基圖像。可以在變換前一次生成,對每一個(gè)n*n的子圖變換都可以使用。
基圖像:
誤差評估:
?
其中,||F-^F||是(F-?^F)的矩陣范數(shù),是變換在(u,v)位置上的系數(shù)方差。
最后的簡化是基于基圖像的規(guī)范正交,并假設(shè)F的像素是通過一個(gè)具有0均值和已知協(xié)方差的隨機(jī)處理產(chǎn)生的。
誤差評估小結(jié)
? ? ? (1)總的均方近似誤差是丟棄的變換系數(shù)的方差之和(也即對于m(u,v) =0的系數(shù)方差之和)。。
? ? ? (2)能把大多數(shù)信息封裝到最少的系數(shù)里去的變換,可得到最好的子圖像的近似,同時(shí)重構(gòu)誤差也最小。
? ? ? (3)在導(dǎo)致等式成立的假設(shè)下,一個(gè)NX N的圖像的(N/n)2個(gè)子圖像的均方誤差是相同的。因此,NX N圖像的均方誤差(是平均誤差的測量)等于一個(gè)子圖像的均方誤差。
變換編碼的幾個(gè)關(guān)鍵問題
■變換的選擇
■對變換的評價(jià)
■子圖尺寸的選擇
■壓縮的位分配(編碼)
變換的選擇
(1)?Karhunen-Loeve變換(KLT)
(2)離散傅立葉變換(DFT)
(3)離散余弦變換(DCT)
(4)?Walsh-Hadamard變換(?WHT)
(5)離散小波變換(DWT)
?
算法的實(shí)現(xiàn)
<1>?計(jì)算模板:方差最大的地方置1,其它地方置0;
<2>量化系數(shù):例如最優(yōu)Lloyd-Max量化器
<3〉結(jié)果編碼:有兩種分配二進(jìn)制位的編碼方法:
①系數(shù)被賦予相同數(shù)量的二進(jìn)制位。
②系數(shù)之間固定地分配---定的二進(jìn)制位。
六、圖像視頻壓縮標(biāo)準(zhǔn)
1、圖像壓縮標(biāo)準(zhǔn)
◆JPEG—— 靜態(tài)圖像壓縮標(biāo)準(zhǔn)
Joint Photographic Experts Group(聯(lián)合圖像專家組)
◆JPEG2000——新一代靜態(tài) 圖像壓縮標(biāo)準(zhǔn)
適用范圍:
?灰度圖像,彩色圖像
?靜止圖像的壓縮,視頻序列幀內(nèi)圖像壓縮
JPEG壓縮標(biāo)準(zhǔn)(ISO 10918-1)
2、JPEG標(biāo)準(zhǔn)的劃分
4種編碼模式
? ? ? ■lossless encoding mode
? ? ? ■DCT based sequential encodingDCT_ based progressive encoding
? ? ? ■DCT_ based hierarchical encoding
3種技術(shù)層次(按算法的復(fù)雜性)
? ? ? ■基本系統(tǒng)(Baseline System)
? ? ? ■擴(kuò)展系統(tǒng)(Extended System,提供二進(jìn)制算術(shù)編碼)
? ? ? ■專用無損失系統(tǒng)(Independent System)
3、JPEG2000壓縮標(biāo)準(zhǔn)(ISO 15444)
? ? ? ■核心技術(shù)是離散小波變換(DWT)
? ? ? ■高壓縮率
? ? ? ■同時(shí)支持有損和無損壓縮
? ? ? ■實(shí)現(xiàn)了漸進(jìn)傳輸
? ? ? ■支持“感興趣區(qū)域”壓縮
4、視頻壓縮
視頻的定義:
? ? ? ■由多副尺寸相同的靜止圖像組成的序列
? ? ? ■與靜止圖像相比,視頻多了一個(gè)時(shí)間軸,成為三維信號
5、視頻編解碼標(biāo)準(zhǔn)
視頻壓縮標(biāo)準(zhǔn)對比:
視頻壓縮標(biāo)準(zhǔn)對比(續(xù)):
6、264/AVC標(biāo)準(zhǔn)
2001年12月,ITU的視頻編編碼專家組(VideoCoding Experts Group, ?簡稱VCEG)與ISO/IEC的MPEG(Motion Picture Experts Group)組成聯(lián)合視頻組(Joint Video Team, ?簡稱JVT) , ?于2003年4月最終制定了H.264/AVC編碼標(biāo)準(zhǔn),其在ITU系列中稱為H.264,在MPEG系列中稱為MPEG-4第10部分高級視頻編碼模式(Advanced Video Coding,簡稱AVC。
H.264/AVC編解碼器的基本架構(gòu)
7、H.264實(shí)現(xiàn)的目標(biāo)
?
■更高的編碼效率,在H.263和MPEG-4的基礎(chǔ)上,保持相同圖像質(zhì)量,節(jié)省50%的比特率。
■更好的圖像質(zhì)量,在各種編碼速率條件下提供滿意的主觀圖像質(zhì)量。
■更強(qiáng)的時(shí)延適應(yīng)性,適應(yīng)低時(shí)延的實(shí)時(shí)通信應(yīng)用,如視頻會議等,也可適應(yīng)高時(shí)延的數(shù)字存儲等應(yīng)用。
■更強(qiáng)的容錯(cuò)能力,適應(yīng)包交換網(wǎng)絡(luò)中的丟包和無線信道中的誤碼。
■更好的網(wǎng)絡(luò)適應(yīng)能力,分離視頻編碼層(VideoCoding?Layer,簡稱VCL)和網(wǎng)絡(luò)適配層(NetAbstraction?Layer,簡稱NAL),適應(yīng)在不同特性的網(wǎng)絡(luò)上打包傳輸。
8、視頻編解碼技術(shù)的下一步發(fā)展趨勢探討
■HEVC ( High Efficiency Video Coding )
■ ?隨著網(wǎng)絡(luò)技術(shù)和終端處理能力的不斷提高,人們對目前廣泛使用的MPEG-2,MPEG-4, H. 264等,提出了新的要求。希望能夠提供:
1)高清
2) 3D
3)移動(dòng)無線
以滿足新的家庭影院、遠(yuǎn)程監(jiān)控、數(shù)字廣播、移動(dòng)流媒體、便攜攝像、醫(yī)學(xué)成像等新領(lǐng)域的應(yīng)用。
■新一代視頻壓 縮標(biāo)準(zhǔn)的核心目標(biāo)是在H. 264/AVC high profile的基礎(chǔ)上,壓縮效率提高一倍。即在保證相同視頻圖像質(zhì)量的前提下,視頻流的碼率減少50%。在提高壓縮效率的同時(shí),可以允許編碼端適當(dāng)提高復(fù)雜度。
Structure of the current HEVC model (HM3)
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的冈萨雷斯《数字图像处理》学习笔记(八)图像压缩的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ios触摸超出_iOS触摸事件处理
- 下一篇: Flexsim循环产生不同类型和数量的临