當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

冈萨雷斯《数字图像处理》学习笔记（八）图像压缩

發(fā)布時(shí)間：2024/1/1 编程问答 50 豆豆

生活随笔收集整理的這篇文章主要介紹了冈萨雷斯《数字图像处理》学习笔记（八）图像压缩小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

一、圖像壓縮基本概念

1、圖像壓縮的可能性

2、圖像壓縮的可能性

二、圖像壓縮模型

三、信息論要素

四、無損壓縮和有損壓縮

五、有損壓縮

1、有損預(yù)測編碼

（1）有損壓縮的基本概念

（2）量化器

（3）量化器的定義

（4）無損到有損——算法演變

2、變換編碼

六、圖像視頻壓縮標(biāo)準(zhǔn)

1、圖像壓縮標(biāo)準(zhǔn)

2、JPEG標(biāo)準(zhǔn)的劃分

3、JPEG2000壓縮標(biāo)準(zhǔn)(ISO 15444)

4、視頻壓縮

5、視頻編解碼標(biāo)準(zhǔn)

6、264/AVC標(biāo)準(zhǔn)

7、H.264實(shí)現(xiàn)的目標(biāo)

8、視頻編解碼技術(shù)的下一步發(fā)展趨勢探討

一、圖像壓縮基本概念

為什么要進(jìn)行圖像壓縮？

舉個(gè)栗子：?一部90分鐘的彩色電影，每秒放映24幀。把它數(shù)字化，每幀512x512象素，每象素的R、G、B三分量分別占8 bit，總比特?cái)?shù)為:90*60*24*3*512*512*8bit=97200MB=95GB.
如一張CD光盤可存600兆字節(jié)數(shù)據(jù)，這部電影圖像(不包括聲音)就需要160張CD光盤用來存儲。

1、圖像壓縮的可能性

圖像作為信源有很大的冗余度，通過編碼的方法減少或去掉這些冗余信息后可以有效壓縮圖像，同時(shí)又不會損害圖像的有效信息。數(shù)據(jù)是用來表示信息的。如果不同的方法為表示等量的信息使用了不同的數(shù)據(jù)量，那么使用較多數(shù)據(jù)量的方法中，有些數(shù)據(jù)必然是代表了無用的信息，或者是重復(fù)地表示了其它數(shù)據(jù)已表示的信息，這就是數(shù)據(jù)冗余的概念。

相對數(shù)據(jù)冗余
如果n1和n2代表兩個(gè)表示相同信息的數(shù)據(jù)集合中所攜載信息單元的數(shù)量，則n1表示的數(shù)據(jù)集合的相對數(shù)據(jù)冗余定義為:

其中為壓縮率

相對數(shù)據(jù)冗余和壓縮率的一些特例

2、圖像壓縮的可能性

■三種基本的數(shù)據(jù)冗余

編碼冗余

如果圖像中平均每個(gè)像素使用的比特?cái)?shù)大于該圖像的信息熵，則圖像中存在冗余。

像素冗余

? ◆反映圖像中像素之間的相互關(guān)系:空間冗余，幾何冗余，幀間冗余

? ◆因?yàn)槿魏谓o定像素的值可以根據(jù)與這個(gè)像素相鄰的像素進(jìn)行預(yù)測，所以單個(gè)像素?cái)y帶的信息相對較少

? ◆對于一幅圖像，很多單個(gè)像素對視覺的貢獻(xiàn)是冗余的。它的值可以通過與它相鄰的像素值為基礎(chǔ)進(jìn)行預(yù)測

? ? ? 如:原圖像數(shù)據(jù): 250 253 251 252 250; ----40bit。

? ? ? ? ? 壓縮后數(shù)據(jù): ?250? ?3? ? 1? ? ?2? ? ?0 ?---- ?14bit。

視覺心理冗余

●人眼感覺到的圖像區(qū)域亮度不僅取決于該區(qū)域的反射光，例如根據(jù)馬赫帶效應(yīng)，在灰度值為常數(shù)的區(qū)域也能感覺到灰度值的變化
●這是由于眼睛對所有視覺信息感受的靈敏度不同。在正常視覺處理過程中各種信息的相對重要程度不同
●有些信息在通常的視覺過程中與另外一些信息相比并不那么重要，我們認(rèn)為這些信息是心理視覺冗余的，去除這些信息并不會明顯降低圖像質(zhì)量
?由于消除心理視覺冗余數(shù)據(jù)會導(dǎo)致一定量信息的丟失，所以這一-過程通常稱為量化
?心理視覺冗余壓縮是不可恢復(fù)的，量化的結(jié)果導(dǎo)致了數(shù)據(jù)有損壓縮。

■如果能減少或消除上述三種冗余的1種或多種冗余，就能取得數(shù)據(jù)壓縮的效果。

保真度準(zhǔn)則——評價(jià)壓縮算法的標(biāo)準(zhǔn)
a.客觀保真度準(zhǔn)則—定量描述
b.主觀保真度準(zhǔn)則—定性或定性基礎(chǔ)上的定量描述

?客觀保真度準(zhǔn)則
如果信息損失的程度，可以表示為原始或輸入圖像與壓縮后又解壓縮輸出的圖像的函數(shù)，這個(gè)函數(shù)就被稱為客觀保真度準(zhǔn)則。
一般表示為：
e(x, y) = f '(x, y) ? f (x, y)
式中：f(x,y)是輸入圖像，f '(x, y)是壓縮后解壓縮的圖像， e(x,y)是誤差函數(shù)
由此可得兩個(gè)圖像之間的均方根誤差：

均方信噪比：

?主觀保真度準(zhǔn)則

通過視覺比較兩個(gè)圖像，給出一個(gè)定性的評價(jià)，如很粗、粗、稍粗、相同、稍好、較好、很好，這種評價(jià)被稱為主觀保真度準(zhǔn)則

二、圖像壓縮模型

一個(gè)圖像壓縮系統(tǒng):編碼器和解碼器。
?編碼器由一個(gè)消除輸了冗余的信源編碼器和一個(gè)用于增強(qiáng)信源編碼輸出的噪聲抗擾性的信道編碼器構(gòu)成。

?解碼器由一個(gè)信源解碼器和一個(gè)信道解碼器構(gòu)成。

信源編碼器

減少或消除輸入圖像中的編碼冗余、像素間冗余及心理視覺冗余。

■轉(zhuǎn)換器:減少像素間冗余,
■量化器:減少心理視覺冗余，該步操作是不可逆的
■符號編碼器:減少編碼冗余
并不是每個(gè)圖像壓縮系統(tǒng)都必須包含這3種操作，如進(jìn)行無誤差壓縮時(shí)，必須去掉量化器

信源解碼器

■符號解碼器:進(jìn)行符號編碼的逆操作

■反向轉(zhuǎn)換器:?進(jìn)行轉(zhuǎn)換器的逆操作
為什么沒有反向量化器??---量化過程導(dǎo)致了不可逆的信息損失

信道編碼器和信道解碼器
■信道編碼是解決可靠性問題，盡量使處理過的信
號在傳輸過程中不出錯(cuò)或少出錯(cuò)，即使出錯(cuò)也要有能力盡量糾正錯(cuò)誤。

■漢明(Hamming)編碼:在編了碼的碼字后面增加足
夠的比特位以保證各個(gè)正確的碼字之間至少有一定數(shù)量的比特位不相同

三、信息論要素

信源的定義：信源指能夠產(chǎn)生信息的事物

如上圖。第一行是信源可能產(chǎn)生的信息，第二行是這些信息出現(xiàn)的概率

信息量：

熵：

編碼應(yīng)用中，熵表示信源中消息的平均信息量。在不考慮消息間的相關(guān)性時(shí)，是無失真代碼平均長度比特?cái)?shù)的下限。

說明該信源編碼平均碼長最短情況下為7/4，不能再小，否則就會引起錯(cuò)誤。而平均碼長比此數(shù)大許多時(shí)，就表明還有待改進(jìn)。

熵的性質(zhì):
(1)?熵是一個(gè)非負(fù)數(shù)，即總有H(s)>=0。
(2)?當(dāng)其中一個(gè)符號sj的出現(xiàn)概率p(sj)=1時(shí)，其余符號si(i≠j)的出現(xiàn)概率p(si)=0，H(s)=0。
(3)?當(dāng)各個(gè)si出現(xiàn)的概率相同時(shí)，則最大平均信息量為logq。(此處對數(shù)以2為底)
(4)熵值總有H(s)<?logq。(此處對數(shù)以2為底)

無失真編碼定理
可以證明，在無干擾的條件下，存在一:種無失真的編碼方法，使編碼的平均長度L與信源的熵H(s)任意地接近,??即L=H(s)+ε。其中ε為任意小的正數(shù)，但以H(s)為其下限即L≥H(s)，這就是香農(nóng)(Shannon)無干擾編碼定理。

編碼效率：

壓縮比：

由香農(nóng)(Shannon)無干擾編碼定理，無失真編碼最大可能的數(shù)據(jù)壓縮比為：

熵與冗余度的關(guān)系
對于無失真圖像的編碼，原始圖像數(shù)據(jù)的壓縮存在一個(gè)下限，即平均碼組長度不能小于原始圖像的熵，而理論上的最佳編碼的平均碼長無限接近原始圖像的熵。

信息冗余度一“信息剩余度”。是指一定數(shù)量的信號單元可能有的最大信息量與其包含的實(shí)際信息量之差。通常用R表示。在通信系統(tǒng)中，信源編碼是降低信號中的信息冗余度的編碼，目的是提高通信系統(tǒng)的有效性；信道編碼是提高信息冗余度的編碼，目的是提高通信系統(tǒng)的可靠性

基本編碼定理

無噪聲編碼定理

噪聲編碼定理

信源編碼定理

四、無損壓縮和有損壓縮

無誤差壓縮的必要性
■??在醫(yī)療或商業(yè)文件的歸檔，有損壓縮因?yàn)榉稍蚨唤?br /> ■?衛(wèi)星成像的收集，考慮數(shù)據(jù)使用和所花費(fèi)用,不希望有任何數(shù)據(jù)損失
■X光拍片，信息的丟失會導(dǎo)致診斷的正確性無損壓縮的壓縮率一般為2-10

無誤差壓縮技術(shù)
■減少像素間冗余:建立一種可替代的圖像表達(dá)方式
減少編碼冗余:對這種表達(dá)方式進(jìn)行編碼

變長編碼
?霍夫曼(Huffman)編碼

?其它變長編碼

?算術(shù)編碼

LZW編碼

位平面編碼

無損預(yù)測編碼

霍夫曼編碼栗子：

幾種變長編碼：

五、有損壓縮

概述
■犧牲圖像復(fù)原的準(zhǔn)確度以換取壓縮能力的增加

■如果產(chǎn)生的失真可以容忍，則壓縮能力的增加是有效的
分類
■有損預(yù)測編碼
?直接對像素在圖像空間進(jìn)行操作，稱為空域方法

■變化編碼
?基于圖像變換的編碼方法，稱為變換域方法

1、有損預(yù)測編碼

（1）有損壓縮的基本概念

有損壓縮是：■通過犧牲圖像的準(zhǔn)確率來達(dá)到增大壓縮率的目的。
? ? ? ? ? ? ? ? ? ? ? ■如果容忍解壓后的結(jié)果中有一定的誤差，那么壓縮率可以顯著提高。
有損壓縮方法的壓縮比:■在圖像壓縮比大于30:1時(shí)，仍然能夠重構(gòu)圖像。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?■在圖像壓縮比為10:1到20:1時(shí)，重構(gòu)圖像與原圖幾乎沒有差別，且無損壓縮的壓縮比很少有能超過3:1的。
有損與無損壓縮的根本差別在于有沒有量化器模塊。

數(shù)據(jù)源編、解碼一般類型：

（2）量化器

■減少數(shù)據(jù)量的最簡單的辦法是將圖像量化成較少的灰度級，通過減少圖像的灰度級來實(shí)現(xiàn)圖像的壓縮;

■這種量化是不可逆的，因而解碼時(shí)圖像有損失。
例如:如果輸入是256個(gè)灰度級，對灰度級量化后輸出，只剩下4個(gè)層次，數(shù)據(jù)量被大大減少。

（3）量化器的定義

階梯形量化函數(shù)t=q(s)，是一個(gè)s的奇函數(shù)(即q(-s)=-q(s))，它可以通過L/2、和來完全描述，從而定義了一個(gè)量化器。
■被稱為量化器的決策級(閾值)?;

■被稱為量化器的重構(gòu)級(代表級)。?

■L:??是量化器的級數(shù)。
由于習(xí)慣的原因，被認(rèn)為是映射到，如果它在半開區(qū)間(,?]

（4）無損到有損——算法演變

基本思想

對無損預(yù)測壓縮的誤差進(jìn)行量化，通過消除視覺心理冗余，達(dá)到對圖像進(jìn)一步壓縮的目的。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ——引入量化（Quantification）

解碼原理及過程

注意:上述方案的壓縮編碼中，預(yù)測器的輸入是fn,??而解壓中的預(yù)測器的輸入是fn'，要使用相同的預(yù)測器，編碼方案要進(jìn)行修改。

修改后的有損預(yù)測編碼：

DPCM簡介
差分脈沖編碼調(diào)制(Differential Pulse CodeModulation, DPCM)，采用反饋方法預(yù)測估值。

編碼原理圖：

2、變換編碼

編碼、解碼流程圖：

變換編碼基本原理

將FFT逆變換??????表達(dá)式進(jìn)行改寫：

變換編碼，即要用等式的右部近似原圖像。

進(jìn)一步改寫：

其中:
1)F是一個(gè)包含了f(x,y)的象素的n*n的矩陣;
2)的值只依賴坐標(biāo)變量x,y,u,v，與T(u,v)和f(x,y)?的值無關(guān)。被稱為基圖像。可以在變換前一次生成，對每一個(gè)n*n的子圖變換都可以使用。

基圖像：

誤差評估：

其中，||F-^F||是(F-?^F)的矩陣范數(shù)，是變換在(u,v)位置上的系數(shù)方差。
最后的簡化是基于基圖像的規(guī)范正交，并假設(shè)F的像素是通過一個(gè)具有0均值和已知協(xié)方差的隨機(jī)處理產(chǎn)生的。

誤差評估小結(jié)

? ? ? (1)總的均方近似誤差是丟棄的變換系數(shù)的方差之和(也即對于m(u,v) =0的系數(shù)方差之和)。。

? ? ? (2)能把大多數(shù)信息封裝到最少的系數(shù)里去的變換，可得到最好的子圖像的近似，同時(shí)重構(gòu)誤差也最小。

? ? ? (3)在導(dǎo)致等式成立的假設(shè)下，一個(gè)NX N的圖像的(N/n)2個(gè)子圖像的均方誤差是相同的。因此，NX N圖像的均方誤差(是平均誤差的測量)等于一個(gè)子圖像的均方誤差。

變換編碼的幾個(gè)關(guān)鍵問題

■變換的選擇

■對變換的評價(jià)

■子圖尺寸的選擇

■壓縮的位分配（編碼）

變換的選擇
(1)?Karhunen-Loeve變換(KLT)

(2)離散傅立葉變換(DFT)

(3)離散余弦變換(DCT)

(4)?Walsh-Hadamard變換(?WHT)

(5)離散小波變換(DWT)

算法的實(shí)現(xiàn)
<1>?計(jì)算模板:方差最大的地方置1，其它地方置0;

<2>量化系數(shù):例如最優(yōu)Lloyd-Max量化器

<3〉結(jié)果編碼:有兩種分配二進(jìn)制位的編碼方法:
①系數(shù)被賦予相同數(shù)量的二進(jìn)制位。
②系數(shù)之間固定地分配---定的二進(jìn)制位。

六、圖像視頻壓縮標(biāo)準(zhǔn)

1、圖像壓縮標(biāo)準(zhǔn)

◆JPEG—— 靜態(tài)圖像壓縮標(biāo)準(zhǔn)
Joint Photographic Experts Group(聯(lián)合圖像專家組)

◆JPEG2000——新一代靜態(tài) 圖像壓縮標(biāo)準(zhǔn)

適用范圍:
?灰度圖像，彩色圖像
?靜止圖像的壓縮，視頻序列幀內(nèi)圖像壓縮

JPEG壓縮標(biāo)準(zhǔn)（ISO 10918-1）

2、JPEG標(biāo)準(zhǔn)的劃分

4種編碼模式

? ? ? ■lossless encoding mode

? ? ? ■DCT based sequential encodingDCT_ based progressive encoding

? ? ? ■DCT_ based hierarchical encoding

3種技術(shù)層次(按算法的復(fù)雜性)

? ? ? ■基本系統(tǒng)(Baseline System)

? ? ? ■擴(kuò)展系統(tǒng)(Extended System,提供二進(jìn)制算術(shù)編碼)

? ? ? ■專用無損失系統(tǒng)(Independent System)

3、JPEG2000壓縮標(biāo)準(zhǔn)(ISO 15444)

? ? ? ■核心技術(shù)是離散小波變換(DWT)

? ? ? ■高壓縮率

? ? ? ■同時(shí)支持有損和無損壓縮

? ? ? ■實(shí)現(xiàn)了漸進(jìn)傳輸

? ? ? ■支持“感興趣區(qū)域”壓縮

4、視頻壓縮

視頻的定義：

? ? ? ■由多副尺寸相同的靜止圖像組成的序列

? ? ? ■與靜止圖像相比，視頻多了一個(gè)時(shí)間軸，成為三維信號

5、視頻編解碼標(biāo)準(zhǔn)

視頻壓縮標(biāo)準(zhǔn)對比：

視頻壓縮標(biāo)準(zhǔn)對比（續(xù)）：

6、264/AVC標(biāo)準(zhǔn)

2001年12月，ITU的視頻編編碼專家組(VideoCoding Experts Group, ?簡稱VCEG)與ISO/IEC的MPEG(Motion Picture Experts Group)組成聯(lián)合視頻組(Joint Video Team, ?簡稱JVT) , ?于2003年4月最終制定了H.264/AVC編碼標(biāo)準(zhǔn),其在ITU系列中稱為H.264，在MPEG系列中稱為MPEG-4第10部分高級視頻編碼模式(Advanced Video Coding，簡稱AVC。

H.264/AVC編解碼器的基本架構(gòu)

7、H.264實(shí)現(xiàn)的目標(biāo)

■更高的編碼效率，在H.263和MPEG-4的基礎(chǔ)上，保持相同圖像質(zhì)量，節(jié)省50%的比特率。

■更好的圖像質(zhì)量，在各種編碼速率條件下提供滿意的主觀圖像質(zhì)量。

■更強(qiáng)的時(shí)延適應(yīng)性，適應(yīng)低時(shí)延的實(shí)時(shí)通信應(yīng)用，如視頻會議等，也可適應(yīng)高時(shí)延的數(shù)字存儲等應(yīng)用。

■更強(qiáng)的容錯(cuò)能力，適應(yīng)包交換網(wǎng)絡(luò)中的丟包和無線信道中的誤碼。

■更好的網(wǎng)絡(luò)適應(yīng)能力，分離視頻編碼層(VideoCoding?Layer,簡稱VCL)和網(wǎng)絡(luò)適配層(NetAbstraction?Layer,簡稱NAL)，適應(yīng)在不同特性的網(wǎng)絡(luò)上打包傳輸。

8、視頻編解碼技術(shù)的下一步發(fā)展趨勢探討

■HEVC ( High Efficiency Video Coding )

■ ?隨著網(wǎng)絡(luò)技術(shù)和終端處理能力的不斷提高，人們對目前廣泛使用的MPEG-2，MPEG-4, H. 264等，提出了新的要求。希望能夠提供:

1)高清

2) 3D

3)移動(dòng)無線

以滿足新的家庭影院、遠(yuǎn)程監(jiān)控、數(shù)字廣播、移動(dòng)流媒體、便攜攝像、醫(yī)學(xué)成像等新領(lǐng)域的應(yīng)用。

■新一代視頻壓縮標(biāo)準(zhǔn)的核心目標(biāo)是在H. 264/AVC high profile的基礎(chǔ)上，壓縮效率提高一倍。即在保證相同視頻圖像質(zhì)量的前提下，視頻流的碼率減少50%。在提高壓縮效率的同時(shí)，可以允許編碼端適當(dāng)提高復(fù)雜度。

Structure of the current HEVC model (HM3)

總結(jié)

以上是生活随笔為你收集整理的冈萨雷斯《数字图像处理》学习笔记（八）图像压缩的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： ios触摸超出_iOS触摸事件处理
下一篇： Flexsim循环产生不同类型和数量的临