数字图像与编码
數(shù)字圖像與編碼
1. 數(shù)字圖像
人類通過感覺器官從外部世界獲取各種形式的信息,并傳遞給大腦,進(jìn)行思維,做出反應(yīng)。其中通過視覺獲取的信息占大部分。圖像信息具有直觀,形象,易懂和信息量大的特點(diǎn),是人類最豐厚的視覺信息來源。照片,圖畫,電影,電視等都屬于圖像的范疇。
圖像按其內(nèi)容的運(yùn)動(dòng)狀態(tài)可分為靜止圖像和運(yùn)動(dòng)圖像兩大類。運(yùn)動(dòng)圖像,沿用電視技術(shù)的術(shù)語,一般稱其為視頻。電視是最普遍的視頻通信方式,以清晰度可分為可視電話,會(huì)議電視,標(biāo)清電視(SDTV),高清電視(HDTV),超高清電視(4K,8K)等。視頻信號(hào)中的每一幅圖像稱為一幀。我國所采用的PAL制電視的分辨率為25幀每秒。
圖像和視頻信號(hào)數(shù)字化具有許多模擬信號(hào)所不具備的優(yōu)點(diǎn)。數(shù)字信號(hào)傳輸質(zhì)量高于模擬信號(hào)傳輸質(zhì)量,可經(jīng)過多次積累而不引起噪聲嚴(yán)重積累;易于采用信道編碼技術(shù)提高傳輸?shù)目煽啃?#xff1b;便于利用時(shí)分復(fù)用技術(shù)與其它通信業(yè)務(wù)相結(jié)合;數(shù)字信號(hào)易于加密,提高信號(hào)的安全性;數(shù)字信號(hào)易于借助計(jì)算機(jī)技術(shù)進(jìn)行處理,存儲(chǔ)。但是信號(hào)數(shù)字化后的數(shù)據(jù)量太大,數(shù)碼率太高,需要巨大的傳輸帶寬和存儲(chǔ)容量。圖像的壓縮與編碼就是在保證圖像質(zhì)量的前提下,用最少量的數(shù)碼實(shí)現(xiàn)數(shù)字圖像的傳輸與存儲(chǔ)。
2. 圖像數(shù)據(jù)壓縮
以高清電視信號(hào)為例,其分辨率為1920x1080,每秒鐘25幀,那么所需帶寬為414.72 Mbps。數(shù)字HDTV傳輸系統(tǒng)要求將1路HDTV圖像信號(hào)的碼率要是到20Mbps,也就是說要求壓縮到原來的1/50。
圖像信號(hào)可以壓縮的根據(jù)有兩方面,一方面是圖像信號(hào)中存在大量冗余度可供壓縮,并且這種冗余度在解碼后還可無失真地恢復(fù);另一方面是可以利用人的視覺特性,在不被主觀視覺察覺的容限內(nèi),通過減少表示信號(hào)的精度,以一定的客觀失真換取數(shù)據(jù)壓縮。
圖像信號(hào)的冗余度存在于結(jié)構(gòu)和統(tǒng)計(jì)兩方面。圖像信號(hào)結(jié)構(gòu)上的冗余度變現(xiàn)為很強(qiáng)的空間(幀內(nèi))和時(shí)間(幀間)相關(guān)性。電視信號(hào)在相鄰像素間,相鄰行間,相鄰幀間存在著這種強(qiáng)相關(guān)性。隱藏,采取適當(dāng)?shù)男盘?hào)處理技術(shù),解出圖像和視頻中由于高度相關(guān)性帶來的冗余,頻帶是可以壓縮的。
信號(hào)統(tǒng)計(jì)上的冗余度來源于被編碼信號(hào)概率密度的分布不均勻。例如在預(yù)測(cè)編碼系統(tǒng)中,需要編碼傳輸?shù)氖穷A(yù)測(cè)誤差信號(hào),它是當(dāng)前待傳像素值與預(yù)測(cè)值間的差分信號(hào)。由于電視信號(hào)在相鄰像素間的強(qiáng)相關(guān)性,預(yù)測(cè)誤差很小,預(yù)測(cè)誤差集中分布在0附近。這種即不均勻的概率分布對(duì)采用變字長編碼壓縮碼率極為有利,因?yàn)樵诰幋a時(shí)可以對(duì)出現(xiàn)概率高的預(yù)測(cè)誤差用短碼,對(duì)出現(xiàn)概率低的預(yù)測(cè)誤差用長碼,則總的平均碼長比用固定碼長編碼短很多。這種編碼叫統(tǒng)計(jì)編碼,熵編碼。
充分利用人的視覺特點(diǎn),是實(shí)現(xiàn)碼率壓縮的又一重要途徑。人眼對(duì)圖像的細(xì)節(jié)(空間)分辨率,運(yùn)動(dòng)(時(shí)間)分辨率和灰度(對(duì)比度)分辨率的要求都有一定的限度。對(duì)于圖像信號(hào)在空間,時(shí)間以及幅度方面進(jìn)行數(shù)字化的精細(xì)程度只要達(dá)到這個(gè)限度即可,超過是沒有意義的。
人眼對(duì)圖像細(xì)節(jié),運(yùn)動(dòng)和灰度三個(gè)方面的分辨率是互相制約的。當(dāng)人眼對(duì)圖像的某種分辨率要求很高時(shí),對(duì)其它方面的分辨率則降低要求。對(duì)于靜止畫面需要40萬個(gè)以上像素的分辨率,對(duì)于運(yùn)動(dòng)畫面,所需要的像素分辨率顯著降低。對(duì)于快速運(yùn)動(dòng)的物體需要30Hz的幀率保持活動(dòng)畫面的連貫性,對(duì)于緩慢運(yùn)動(dòng)的場景和靜止的場景幀率可以適當(dāng)降低。
僅在觀察圖像中的大塊面積時(shí),人眼才能分辨出全部256個(gè)灰度等級(jí)。而當(dāng)觀察圖像局部的小塊面積或精致細(xì)節(jié)時(shí),并不需要那么多的灰度等級(jí)。在灰度突變處,由于視覺的掩蓋效應(yīng),人眼不能察覺到很細(xì)致的灰度差別。
當(dāng)傳送一個(gè)快速運(yùn)動(dòng)圖像時(shí),只需要采用較少的灰度等級(jí),因?yàn)槿搜圩⒁庥^察運(yùn)動(dòng)物體時(shí),對(duì)灰度的分辨能力下降。
利用上述視覺特性,在進(jìn)行圖像數(shù)字化時(shí)可以采用自適應(yīng)技術(shù),即根據(jù)圖像的每一局部的特點(diǎn)來決定對(duì)它的取樣頻率和量化的精度,盡量做到與人眼觀看這種圖像局部時(shí)相關(guān)的視覺特點(diǎn)相適配。
3. 圖像壓縮信源編碼過程
圖像和視頻信源編碼的整個(gè)過程一般由以下三個(gè)步驟完成。
其中信號(hào)映射和統(tǒng)計(jì)編碼這兩個(gè)環(huán)節(jié)是可逆的過程,而量化是不可逆的,即量化會(huì)產(chǎn)生失真。
PCM是由模擬信號(hào)轉(zhuǎn)變?yōu)閿?shù)字信號(hào)所必需經(jīng)過的取樣,量化過程。PCM對(duì)模擬信號(hào)在時(shí)間,空間和幅值上的離散處理會(huì)不可避免地引入誤差。為了保證圖像和視頻信號(hào)從模擬形式變成PCM信號(hào)不產(chǎn)生主觀上可以察覺的誤差,必需保證對(duì)信號(hào)有足夠高的取樣頻率和量化精度。除過模擬到數(shù)字信號(hào)的PCM量化外,信源編碼過程中的量化實(shí)際上是對(duì)信號(hào)的2次量化。
數(shù)字信號(hào)在信道中傳輸時(shí),由于干擾會(huì)產(chǎn)生傳輸誤碼,特別是當(dāng)通過信源編碼使冗余度壓縮越多時(shí),誤碼影響越嚴(yán)重。所以一般在經(jīng)過信源編碼之后,都要在編碼后的碼流中有目的地按一定規(guī)則加入差錯(cuò)校正碼,進(jìn)行誤碼防護(hù),這就是信道編碼。顯然對(duì)整個(gè)通信系統(tǒng)而言,信道編碼增加的冗余度比信源編碼去除的冗余度要小的多,從而在通信的有效性和可靠性間實(shí)現(xiàn)合理的平衡。
4. 圖像編碼算法分類
圖像編碼技術(shù)有多種分類方法。根據(jù)編碼對(duì)象的不同,可分為靜止圖像編碼,活動(dòng)圖像編碼,黑白圖像編碼,彩色圖像編碼等。根據(jù)壓縮過程中有無信息損失可分為有損編碼,無損編碼。根據(jù)算法中是否采用自適應(yīng)技術(shù),可分為自適應(yīng)編碼和非自適應(yīng)編碼。最常見的是按算法原來進(jìn)行分類。常見的圖像編碼算法主要有如下幾類:
4.1 預(yù)測(cè)編碼
預(yù)測(cè)編碼使利用圖像信號(hào)在局部空間和時(shí)間范圍內(nèi)的高度相關(guān)性,以已經(jīng)傳出的近鄰像素為參考,預(yù)測(cè)當(dāng)前像素值,然后量化,編碼預(yù)測(cè)誤差。最常用的是差分脈沖編碼調(diào)制(DPCM)。
與運(yùn)動(dòng)估值技術(shù)相結(jié)合的運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)是目前視頻壓縮編碼系統(tǒng)中去除信號(hào)時(shí)間域冗余信息最常用的方法。
4.2 編換編碼
變換編碼使將一組像素值經(jīng)過某種形式的正交變換轉(zhuǎn)換成一組變換系數(shù),然后根據(jù)人的主觀視覺特性對(duì)各變換系數(shù)進(jìn)行不同精度的量化后編碼的技術(shù)。正交變換的作用是解出像素間的空間相關(guān)性,降低冗余度。用于圖像編碼的正交變換如離散傅里葉變換(DFT),沃爾什-哈達(dá)嗎變換(WHT),哈爾變換(Harr),離散余弦變換(DCT)等。這些變換一般都有快速算法。
DCT已被目前的多種靜止和活動(dòng)圖像編碼的國際標(biāo)準(zhǔn)所采用。
4.3 統(tǒng)計(jì)編碼
這是一類根據(jù)信息熵原理進(jìn)行的信息保持型邊字長編碼,也稱熵編碼。編碼時(shí)對(duì)出現(xiàn)概率高的時(shí)間用短碼表示,對(duì)出現(xiàn)概率低的事件用長碼表示。在目前圖像編碼國際標(biāo)準(zhǔn)中,常見的熵編碼有霍夫曼(Huffman)編碼和算術(shù)編碼。
4.4 子帶編碼
子帶編碼屬于分析-綜合類的編碼技術(shù)。子帶編碼的基本思想是,在編碼端將圖像信號(hào)在頻率域分裂成若干子帶(subband),而后對(duì)各個(gè)子帶用與其統(tǒng)計(jì)特性相適合的編碼器及比特分配方案進(jìn)行數(shù)據(jù)壓縮。
除了通過專門設(shè)計(jì)的正交鏡像濾波器實(shí)現(xiàn)的經(jīng)典子帶編碼方法之外,小波變換是目前使用最多的子帶編碼方法。
4.5 基于模型的編碼
模型基圖像編碼是一種基于景物三維模型的參數(shù)編碼方法。相對(duì)于基于波形的編碼方法而言,對(duì)參數(shù)編碼所需的比特?cái)?shù)要少得多。依據(jù)對(duì)圖像內(nèi)容先驗(yàn)知識(shí)的了解,在編解碼雙方建立一個(gè)相同景物的三維模型,基于這個(gè)模型,在編碼器中對(duì)圖像內(nèi)容進(jìn)行分析,提取景物參數(shù),然后將這些參數(shù)編碼傳送給解碼端,解碼端根據(jù)接收到的參數(shù)和建立起的景物模型,采用圖像合成技術(shù)再重建圖像。
模型編碼也屬于分析-綜合編碼技術(shù)。模型基圖像編碼目前主要用于以頭肩像為對(duì)象的低碼率可視電話編碼。
4.6 其它編碼算法
除過上述幾大類編碼算法外,還有很多其它壓縮算法,例如比特平面編碼,矢量量化編碼,塊截?cái)嗑幋a,神經(jīng)網(wǎng)絡(luò)編碼,輪廓編碼等。
5. 圖像編碼的標(biāo)準(zhǔn)
ITU(國際電信聯(lián)盟)和ISO/IEC(國際標(biāo)準(zhǔn)化組織)等幾大標(biāo)準(zhǔn)化組織自20世紀(jì)80年代后期以來在全世界范圍內(nèi)積極推動(dòng),聯(lián)合各國在相關(guān)領(lǐng)域的專家進(jìn)行共同研究,先后制定了一系列靜止和活動(dòng)圖像編碼的國際標(biāo)準(zhǔn),并致力于面向未來的多媒體編碼標(biāo)準(zhǔn)的研究。
關(guān)于靜止圖像壓縮編碼,1991年通過了JPEG標(biāo)準(zhǔn)。2000年,JPEG委員會(huì)公布的國際標(biāo)準(zhǔn)JPEG 2000以小波變換作為基本算法,采用了嵌入式編碼技術(shù),在達(dá)到更高的圖像質(zhì)量和更高的壓縮效率的同時(shí),還能滿足在移動(dòng)和網(wǎng)絡(luò)環(huán)境下對(duì)互操作性和可分級(jí)性的要求。
1990年頒布了用于視聽業(yè)務(wù)的視頻編碼標(biāo)準(zhǔn)即H.261。隨后ITU-T針對(duì)不同的電信通信網(wǎng)絡(luò)中對(duì)實(shí)時(shí)視頻通信系統(tǒng)的需要,先后完成了H.26X系列中多個(gè)視頻編碼標(biāo)準(zhǔn),其中包括H.261,H.262,H.263,H.264,H.265。
在H.261制定的同時(shí),ISO/IES聯(lián)合技術(shù)委員會(huì)下屬的分委員會(huì)于1988年成立了運(yùn)動(dòng)圖像專家組MPEG。該委員會(huì)先后通過了MPEG系列的多個(gè)音視頻壓縮編碼標(biāo)準(zhǔn),包括MPEG-1,MPEG-2,MPEG4等。
ITU-T和ISO/IES這兩個(gè)標(biāo)準(zhǔn)化組織除了獨(dú)立制定相關(guān)標(biāo)準(zhǔn)外,還進(jìn)行合作。于2001年成立了視頻聯(lián)合工作組JVT。2003年該工作組正式公布了H.264/MPEG-4 AVC。H.264/MPEG-4 AVC的壓縮性能明顯超出了以前的視頻壓縮標(biāo)準(zhǔn)。
HEVC是High Efficiency Video Coding的縮寫,是一種新的視頻壓縮標(biāo)準(zhǔn),用來以替代H.264/AVC編碼標(biāo)準(zhǔn),2013年1月26號(hào),HEVC正式成為國際標(biāo)準(zhǔn)。
總結(jié)
- 上一篇: C语言题目:输入顾客在超市消费金额和顾客
- 下一篇: 【学习】人工智能:一种现代的方法