主流视频编码压缩技术基本概念(一)
生活随笔
收集整理的這篇文章主要介紹了
主流视频编码压缩技术基本概念(一)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
主流視頻編碼壓縮技術基本概念(一)
- 一、多媒體技術基本
- 1、圖像的色彩模型
- 二、 靜態圖像壓縮技術
- 三、視頻編碼壓縮技術基礎
- 有冗余就有可壓縮的數據
- 圖像通用格式
一、多媒體技術基本
1、圖像的色彩模型
圖像的彩色模型
二、 靜態圖像壓縮技術
圖像壓縮編碼
有損壓縮編碼
變換編碼
離散余弦變換
離散小波
離散博立葉
混合編碼
JPEG編碼
JPEG編碼的具體步驟
量化
量化表中數除以DCT系數矩陣 得到量化后的DCT系數矩陣
DCT系數矩陣/量化系數
無損壓縮編碼(統計編碼)
Huffman編碼
行程編碼
LZW編碼
算術編碼
三、視頻編碼壓縮技術基礎
有冗余就有可壓縮的數據
1. 空間冗余: 這是圖像數據中經常存在的一種冗余,在同一幅圖像中,規則物體和規則背景的表面物理特性具有相關性,這是相關性的光成像結構在數字化圖像中就表現為空間冗余。2. 時間冗余:這是序列圖像和語言數據中經常包含的冗余,圖像序列中的兩幅相鄰的圖像之間有較大的相關性,這反映為時間冗余3. 視覺冗余:人類視覺系統并不是對任何圖像的變化都很敏感,人眼對于圖像的注意是非均勻的。實際上,人類視覺系統一般分辨能力約為64灰度等級,而一般圖像量化采用256灰度等級,這類冗余我們稱為視覺冗余。圖像通用格式
CIF(Common Intermediate Format, 通用中間格式)CIF格式是基于YCrCb的彩色模式。CIF格式規定圖像的亮度分量Y的橫向像素為<font color='red'>352</font>個,縱向像素為288個。圖像色度分量Cr、Cb的縱橫像素數為亮度分量的一半。電視圖像的縱橫比為3:4, 與常規電視屏幕尺寸比例一致。像素的縱橫比為:像素縱橫比=縱:橫= 3/288: 4/352 = 11:12通常,視頻編碼算法把輸入的CIF格式的視頻分成一系列以'塊' 為基礎的層次結構,分別為四個層次:圖像(Picture)塊組(GOB)宏塊(MB)塊(Block) 圖像宏塊與塊說明在視頻編碼過程中,為了使算法出來單元高效處理,通常把每幀圖像分成宏塊及塊。例子(CIF圖像):每幀圖像有12個塊組每個塊組有33個宏塊每個宏塊有6個子塊(4個亮度塊、2個色度塊)宏塊是運動補償(視頻編碼關鍵技術)的基本單位。壓縮原理與步驟
時域模型
消除連續視頻幀之間的冗余
殘差(圖像):當前幀與參考幀相減得到的圖像;
MPEG-4以及H.264中,預測幀一般采用當前的之前或之后的一幀作為參考預測幀。
利用運動補償技術來降低預測幀與當前幀的差別。
時域模型的輸出是當前幀與預測幀相減得到的殘差圖像以及運動模型
參數(如運動矢量)
空域模型
目的是消除圖像或殘差圖像的空域相關性,將其轉換成一種便于熵編碼的格式。實際的空域模型分成三個部分變換:消除數據相關性量化:降低變換域數據精度重新排序:對數據重新排序,將重要的數據集中到一起。在MPEG-4及H.264編碼壓縮方式中,編碼器對殘差圖像進行頻域變換(DCT)、量化之后作為空域模型的輸出。編碼過程中,需要消除相鄰幀之間的時域信息冗余,即僅僅傳輸相鄰幀之間對應宏塊的差值(殘差圖像).
差值(殘差圖像)不是前后兩幀對應像素的直接相減的差值,而是需要在前幀(參考幀)內,對應于后幀的宏塊位置的附近區域內;
搜索知道一個最匹配的宏塊(最相似的宏塊,甚至能找到完全相同的宏塊)
并得到宏塊在水平及垂直方向上的位移(運動矢量)
然后傳送這個兩個宏塊之間的差值以及運動矢量。
運動估計
概念運動估計(Motion Estimation, ME)就是搜索最佳匹配塊的過程,或者說是尋找最優的運動向量的過程。基本思想將圖像序列的幀分成多個宏塊對每個宏塊在參考幀的某個給定搜索范圍內,根據一定的匹配準則找出與當前塊最相似的塊,即最佳匹配塊;匹配塊與當前塊的相對位移即為運動矢量(Motion Vecotrs, MV)視頻圖像編碼壓縮技術的評價準則
視頻編碼基本概念 :https://chensongpoixs.github.io/cvideo_codec/
總結
以上是生活随笔為你收集整理的主流视频编码压缩技术基本概念(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: oracle11g exp 00028,
- 下一篇: MATLAB判断是不是质数,MATLAB