数字图像处理:图像与编码
目錄
- 數字圖像與編碼
- 1. 數字圖像
- 1.1關于圖像清晰度和分辨率的對照表:
- 2. 圖像數據壓縮
- 2.1 帶寬計算
- 3. 圖像壓縮信源編碼過程
- 4. 圖像編碼算法分類
- 4.1 預測編碼
- 4.2 編換編碼
- 4.3 統計編碼
- 4.4 子帶編碼
- 4.5 基于模型的編碼
- 4.6 其它編碼算法
- 5. 圖像編碼的標準
數字圖像與編碼
1. 數字圖像
數字圖像(digital image),是以二維數字組形式表示的圖像,其數字單元為 像元 , 其形式由數組或矩陣表示,其光照位置和強度都是離散的。 數字圖像是由模擬圖像經過數字化得到的,并以像素為基本元素的,可以用數字電路存儲和處理的圖像。
圖像信息具有直觀,形象,易懂和信息量大的特點,圖像按其內容的運動狀態可分為靜止圖像和運動圖像兩大類(即:圖片和視頻)。
1.1關于圖像清晰度和分辨率的對照表:
| 540p / qHD | 960×540 pixels |
| 720p / HD | 1280×720 pixels |
| 1080p / Full HD / FHD | 19201080 pixels |
| 2K | 2048×1080 pixels |
| 1440p / QHD / QuadHD / WQHD | 2560×1440 pixels |
| 2160p / UHD | 3840×2160 pixels |
| 4K | 4096×2160 pixels |
| 5K | 5120×2880 pixels |
| 8K / 8K UHD | 7680×4320 pixels |
圖像和視頻信號數字化具有許多模擬信號所不具備的優點。數字信號傳輸質量高于模擬信號傳輸質量,可經過多次積累而不引起噪聲嚴重積累;易于采用信道編碼技術提高傳輸的可靠性;便于利用時分復用技術與其它通信業務相結合;數字信號易于加密,提高信號的安全性;數字信號易于借助計算機技術進行處理,存儲。圖像的壓縮與編碼就是在保證圖像質量的前提下,用最少量的數碼實現數字圖像的傳輸與存儲。
2. 圖像數據壓縮
碼流(Data Rate)
指視頻文件在單位時間內使用的數據流量,也叫碼率或碼流率。
我們用的單位是Kb/s或者Mb/s。一般來說同樣分辨率下,視頻文件的碼流越大,壓縮比就越小,畫面質量就越高。碼流越大,說明單位時間內取樣率越大,數據流,精度就越高,處理出來的文件就越接近原始文件,圖像質量越好,畫質越清晰,要求播放設備的解碼能力也越高。
幀率(frame rate)
1秒鐘時間里傳輸的圖片的幀數,也可以理解為圖形處理器每秒鐘能夠刷新幾次,通常用fps(Frames Per Second)表示。高的幀率可以得到更流暢、更逼真的動畫。每秒鐘幀數 (fps) 愈多,所顯示的動作就會愈流暢。
2.1 帶寬計算
計算視頻流的近似帶寬是將捕獲圖像的分辨率乘以運動圖像的幀數。還有其他因素,例如音頻帶寬和協議(通信和壓縮)的開銷。但是,這些不會顯著增加帶寬。因此,適用的公式是:
幀大小Frame Size = 分辨率Resolution * 顏色深度Colour Depth(色度/亮度信息) 比特率Bit Rate = 幀大小 Frame Size * 幀速率Frame Rate(fps)如果我們拍攝以D1(DVD)分辨率(即720 x 480)捕獲圖像并以30 fps(每秒幀數)傳輸的相機;相關數字加起來如下:視頻傳輸帶寬=屏幕像素點*3*屏幕色深*屏幕刷新率; //常數 3 是紅綠藍分量 幀大小 = (720*480)*24(3*8) = 829440 位 = ~ 830 Kbps(千位/秒Kbits/sec) 比特率 = 829440 *30 = 248832000 = ~ 250 Mbps(兆位/秒Mbits/sec)| 1 Kbps | 0.001000 Mbps |
| 2 Kbps | 0.002000 Mbps |
| 3 Kbps | 0.003000 Mbps |
| 4 Kbps | 0.004000 Mbps |
| 1 Mbps | 0.001000 Gbps |
| 2 Mbps | 0.002000 Gbps |
| 3 Mbps | 0.003000 Gbps |
| 4 Mbps | 0.004000 Gbps |
以4K(3840x2160)@30Hz信號為例,需傳輸帶寬為5.97Gbps。
視頻傳輸帶寬=屏幕像素點3屏幕色深屏幕刷新率;
3840216038*30=5.97Gbps
圖像信號可以壓縮的根據有兩方面,一方面是圖像信號中存在大量冗余度壓縮,這種冗余度在解碼后可無失真恢復;另一方面是利用人的視覺特性,在不被主觀視覺察覺的容限內,通過減少表示信號的精度,以失真換取數據壓縮。
圖像信號的冗余度存在于結構和統計兩方面。圖像信號結構上的冗余度變現為很強的空間(幀內)和時間(幀間)相關性。電視信號在相鄰像素間,相鄰行間,相鄰幀間存在著這種強相關性。通過隱藏并采取適當的信號處理技術,解出圖像和視頻中由于高度相關性帶來的冗余,讓頻帶可以壓縮。
信號統計上的冗余度來源于被編碼信號概率密度的分布不均勻。例如在預測編碼系統中,需要編碼傳輸的是預測誤差信號,它是當前待傳像素值與預測值間的差分信號。由于電視信號在相鄰像素間的強相關性,預測誤差很小,預測誤差集中分布在0附近。這種即不均勻的概率分布對采用變字長編碼壓縮碼率極為有利,因為在編碼時可以對出現概率高的預測誤差用短碼,對出現概率低的預測誤差用長碼,則總的平均碼長比用固定碼長編碼短很多。這種編碼叫統計編碼(熵編碼)。
3. 圖像壓縮信源編碼過程
圖像和視頻信源編碼的整個過程一般由以下三個步驟完成。
對表示信號的形式進行某種映射,即變換描寫信號的方式。通過這種映射解除或削弱存在于圖像信號內部的相關性,降低其冗余度。例如,在預測編碼中,取代原始的像素值,用預測誤差表示信號。
在滿足對圖像質量一定要求的前提下,減少表示信號的精度。這通過采用符合主觀視覺特性的量化來實現。
利用統計編碼(例如霍夫曼編碼,算術編碼等)消除追蹤被編碼符號所含的統計冗余度。
其中信號映射和統計編碼這兩個環節是可逆的過程,而量化是不可逆的,即量化必然產生失真。
PCM是由模擬信號轉變為數字信號所必需經過的取樣,量化過程。PCM對模擬信號在時間,空間和幅值上的離散處理會不可避免地引入誤差。為了保證圖像和視頻信號從模擬形式變成PCM信號不產生主觀上可以察覺的誤差,必需保證對信號有足夠高的取樣頻率和量化精度。除過模擬到數字信號的PCM量化外,信源編碼過程中的量化實際上是對信號的2次量化。
數字信號在信道中傳輸時,由于干擾會產生傳輸誤碼,特別是當通過信源編碼使冗余度壓縮越多時,誤碼影響越嚴重。所以一般在經過信源編碼之后,都要在編碼后的碼流中有目的地按一定規則加入差錯校正碼,進行誤碼防護,這就是信道編碼。顯然對整個通信系統而言,信道編碼增加的冗余度比信源編碼去除的冗余度要小的多,從而在通信的有效性和可靠性間實現合理的平衡。
4. 圖像編碼算法分類
圖像編碼技術有多種分類方法。根據編碼對象的不同,可分為靜止圖像編碼,活動圖像編碼,黑白圖像編碼,彩色圖像編碼等。根據壓縮過程中有無信息損失可分為有損編碼,無損編碼。根據算法中是否采用自適應技術,可分為自適應編碼和非自適應編碼。最常見的是按算法原來進行分類。常見的圖像編碼算法主要有如下幾類:
4.1 預測編碼
預測編碼使利用圖像信號在局部空間和時間范圍內的高度相關性,以已經傳出的近鄰像素為參考,預測當前像素值,然后量化,編碼預測誤差。最常用的是差分脈沖編碼調制(DPCM)。
與運動估值技術相結合的運動補償幀間預測是目前視頻壓縮編碼系統中去除信號時間域冗余信息最常用的方法。
4.2 編換編碼
變換編碼使將一組像素值經過某種形式的正交變換轉換成一組變換系數,然后根據人的主觀視覺特性對各變換系數進行不同精度的量化后編碼的技術。正交變換的作用是解出像素間的空間相關性,降低冗余度。用于圖像編碼的正交變換如離散傅里葉變換(DFT),沃爾什-哈達嗎變換(WHT),哈爾變換(Harr),離散余弦變換(DCT)等。這些變換一般都有快速算法。
DCT已被目前的多種靜止和活動圖像編碼的國際標準所采用。
4.3 統計編碼
這是一類根據信息熵原理進行的信息保持型邊字長編碼,也稱熵編碼。編碼時對出現概率高的時間用短碼表示,對出現概率低的事件用長碼表示。在目前圖像編碼國際標準中,常見的熵編碼有霍夫曼(Huffman)編碼和算術編碼。
4.4 子帶編碼
子帶編碼屬于分析-綜合類的編碼技術。子帶編碼的基本思想是,在編碼端將圖像信號在頻率域分裂成若干子帶(subband),而后對各個子帶用與其統計特性相適合的編碼器及比特分配方案進行數據壓縮。
除了通過專門設計的正交鏡像濾波器實現的經典子帶編碼方法之外,小波變換是目前使用最多的子帶編碼方法。
4.5 基于模型的編碼
模型基圖像編碼是一種基于景物三維模型的參數編碼方法。相對于基于波形的編碼方法而言,對參數編碼所需的比特數要少得多。依據對圖像內容先驗知識的了解,在編解碼雙方建立一個相同景物的三維模型,基于這個模型,在編碼器中對圖像內容進行分析,提取景物參數,然后將這些參數編碼傳送給解碼端,解碼端根據接收到的參數和建立起的景物模型,采用圖像合成技術再重建圖像。
模型編碼也屬于分析-綜合編碼技術。模型基圖像編碼目前主要用于以頭肩像為對象的低碼率可視電話編碼。
4.6 其它編碼算法
除過上述幾大類編碼算法外,還有很多其它壓縮算法,例如比特平面編碼,矢量量化編碼,塊截斷編碼,神經網絡編碼,輪廓編碼等。
5. 圖像編碼的標準
ITU(國際電信聯盟)和ISO/IEC(國際標準化組織)等幾大標準化組織自20世紀80年代后期以來在全世界范圍內積極推動,聯合各國在相關領域的專家進行共同研究,先后制定了一系列靜止和活動圖像編碼的國際標準,并致力于面向未來的多媒體編碼標準的研究。
關于靜止圖像壓縮編碼,1991年通過了JPEG標準。2000年,JPEG委員會公布的國際標準JPEG 2000以小波變換作為基本算法,采用了嵌入式編碼技術,在達到更高的圖像質量和更高的壓縮效率的同時,還能滿足在移動和網絡環境下對互操作性和可分級性的要求。
1990年頒布了用于視聽業務的視頻編碼標準即H.261。隨后ITU-T針對不同的電信通信網絡中對實時視頻通信系統的需要,先后完成了H.26X系列中多個視頻編碼標準,其中包括H.261,H.262,H.263,H.264,H.265。
在H.261制定的同時,ISO/IES聯合技術委員會下屬的分委員會于1988年成立了運動圖像專家組MPEG。該委員會先后通過了MPEG系列的多個音視頻壓縮編碼標準,包括MPEG-1,MPEG-2,MPEG4等。
ITU-T和ISO/IES這兩個標準化組織除了獨立制定相關標準外,還進行合作。于2001年成立了視頻聯合工作組JVT。2003年該工作組正式公布了H.264/MPEG-4 AVC。H.264/MPEG-4 AVC的壓縮性能明顯超出了以前的視頻壓縮標準。
HEVC是High Efficiency Video Coding的縮寫,是一種新的視頻壓縮標準,用來以替代H.264/AVC編碼標準,2013年1月26號,HEVC正式成為國際標準。
總結
以上是生活随笔為你收集整理的数字图像处理:图像与编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机基础硬件知识试题及答案,计算机基础
- 下一篇: TCP协议和UDP协议