當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

主流视频编码压缩技术基本概念（一）

發布時間：2024/3/12 编程问答 51 豆豆

生活随笔收集整理的這篇文章主要介紹了主流视频编码压缩技术基本概念（一）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

主流視頻編碼壓縮技術基本概念（一）

- 一、多媒體技術基本
- - 1、圖像的色彩模型
- 二、靜態圖像壓縮技術
- 三、視頻編碼壓縮技術基礎
- - 有冗余就有可壓縮的數據
  - 圖像通用格式

一、多媒體技術基本

1、圖像的色彩模型

圖像的彩色模型

彩色模型又叫做顏色空間

在多媒體系統中，必然涉及到用不同的色彩模型表示圖像的顏色。

二、靜態圖像壓縮技術

圖像壓縮編碼

有損壓縮編碼

變換編碼

離散余弦變換

或稱為DCT變換（Discreate Cosine Transform）簡言之、DCT變換可以將8行8列的數組(或矩陣)變換成另外一個8行8列的數組(或矩陣)直流系數（DC）黑色區域是的數據稱為直流系數，或叫做直流分量，也叫做低頻分量；在DCT變換后的64個系數中，低頻分量包含了圖像亮度的主要信息。交流系數 (AC)灰色區域的數據稱為交流系數、或叫做交流分量，灰色區域叫做中頻分量，白色區域叫做高頻分量；

離散小波

離散博立葉

混合編碼

JPEG編碼

JPEG編碼的具體步驟

量化

量化表中數除以DCT系數矩陣得到量化后的DCT系數矩陣

DCT系數矩陣/量化系數

DC系數及AC系數編碼DC系數編碼DC系數反映了8X8數據塊的主要信息(平均亮度)，一般與相鄰塊有較大的相關性。所以對DC系數作差分編碼，即用前一個數據塊的DC系數作為當前塊的預測值，再計算當前塊的實際值與預測值的差值，最后對這個差值進行 Huffman編碼。AC系數編碼AC系數經過Z型排列后，更有可能出現連續的0組成的字符串，從而對其進行行程編碼將有有利于壓縮。行程編碼例子編碼前：00000000000000202000000000007000000000000000000編碼后:[14,0][1,2][1,0][1,2][8,0][1,7][17,0]

MPEGH.264

無損壓縮編碼(統計編碼)

Huffman編碼

行程編碼

LZW編碼

算術編碼

三、視頻編碼壓縮技術基礎

有冗余就有可壓縮的數據

1. 空間冗余：這是圖像數據中經常存在的一種冗余，在同一幅圖像中，規則物體和規則背景的表面物理特性具有相關性，這是相關性的光成像結構在數字化圖像中就表現為空間冗余。2. 時間冗余：這是序列圖像和語言數據中經常包含的冗余，圖像序列中的兩幅相鄰的圖像之間有較大的相關性，這反映為時間冗余3. 視覺冗余：人類視覺系統并不是對任何圖像的變化都很敏感，人眼對于圖像的注意是非均勻的。實際上，人類視覺系統一般分辨能力約為64灰度等級，而一般圖像量化采用256灰度等級，這類冗余我們稱為視覺冗余。

圖像通用格式

CIF（Common Intermediate Format，通用中間格式）CIF格式是基于YCrCb的彩色模式。CIF格式規定圖像的亮度分量Y的橫向像素為352個,縱向像素為288個。圖像色度分量Cr、Cb的縱橫像素數為亮度分量的一半。電視圖像的縱橫比為3:4，與常規電視屏幕尺寸比例一致。像素的縱橫比為：像素縱橫比=縱：橫= 3/288: 4/352 = 11:12通常，視頻編碼算法把輸入的CIF格式的視頻分成一系列以'塊' 為基礎的層次結構，分別為四個層次：圖像(Picture)塊組(GOB)宏塊(MB)塊(Block)

圖像宏塊與塊說明在視頻編碼過程中，為了使算法出來單元高效處理，通常把每幀圖像分成宏塊及塊。例子（CIF圖像）：每幀圖像有12個塊組每個塊組有33個宏塊每個宏塊有6個子塊(4個亮度塊、2個色度塊)宏塊是運動補償(視頻編碼關鍵技術)的基本單位。

壓縮原理與步驟

時域模型

消除連續視頻幀之間的冗余

殘差(圖像)：當前幀與參考幀相減得到的圖像；

MPEG-4以及H.264中，預測幀一般采用當前的之前或之后的一幀作為參考預測幀。

利用運動補償技術來降低預測幀與當前幀的差別。

時域模型的輸出是當前幀與預測幀相減得到的殘差圖像以及運動模型

參數(如運動矢量)

空域模型

目的是消除圖像或殘差圖像的空域相關性，將其轉換成一種便于熵編碼的格式。實際的空域模型分成三個部分變換：消除數據相關性量化：降低變換域數據精度重新排序：對數據重新排序，將重要的數據集中到一起。在MPEG-4及H.264編碼壓縮方式中，編碼器對殘差圖像進行頻域變換(DCT)、量化之后作為空域模型的輸出。

編碼過程中，需要消除相鄰幀之間的時域信息冗余，即僅僅傳輸相鄰幀之間對應宏塊的差值(殘差圖像).

差值(殘差圖像)不是前后兩幀對應像素的直接相減的差值，而是需要在前幀(參考幀)內，對應于后幀的宏塊位置的附近區域內；

搜索知道一個最匹配的宏塊(最相似的宏塊，甚至能找到完全相同的宏塊)

并得到宏塊在水平及垂直方向上的位移(運動矢量)

然后傳送這個兩個宏塊之間的差值以及運動矢量。

運動估計

概念運動估計（Motion Estimation, ME）就是搜索最佳匹配塊的過程，或者說是尋找最優的運動向量的過程。基本思想將圖像序列的幀分成多個宏塊對每個宏塊在參考幀的某個給定搜索范圍內，根據一定的匹配準則找出與當前塊最相似的塊，即最佳匹配塊；匹配塊與當前塊的相對位移即為運動矢量(Motion Vecotrs, MV)

視頻圖像編碼壓縮技術的評價準則

碼率

重建圖像的質量

編碼/解碼延時

錯誤修復能力

算法復雜程度

視頻編碼基本概念：https://chensongpoixs.github.io/cvideo_codec/

總結

以上是生活随笔為你收集整理的主流视频编码压缩技术基本概念（一）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： oracle11g exp 00028,
下一篇： MATLAB判断是不是质数,MATLAB