走进音视频的世界——杜比音效之AC3与AC4
杜比音效是由杜比實(shí)驗室開發(fā)的,涉及多聲道音頻壓縮技術(shù)。這種數(shù)字壓縮技術(shù)目標(biāo)是生成數(shù)字音頻信號,當(dāng)解碼重現(xiàn)時,聲音與原始信號相同。同時使用最低碼率進(jìn)行壓縮,提供真實(shí)的立體環(huán)繞聲。因此,杜比音效廣泛應(yīng)用于電影院、家庭影音、DVD、藍(lán)光光盤。杜比音效系列主要包括:Dolby AC3、Dolby AC3 Plus、Dolby AC4和Dolby TrueHD。杜比實(shí)驗室發(fā)布的環(huán)繞聲系統(tǒng)歷史演進(jìn)如下表所示:
| 杜比MP矩陣 | 1975年 | 電影院采用光學(xué)技術(shù)。使用杜比A降低噪音。杜比立體聲處理器將4:2編碼為35mm膠片,并將2:4解碼回4.0。 | 帶C和MonoSurround矩陣的FL FR |
| / | 1982年 | 杜比立體聲的消費(fèi)者變體。原始解碼器利用帶有延遲和幻像中心的簡單無源LR電路進(jìn)行3通道解碼。 | FL FR和MonoSurround矩陣 |
| 杜比MP矩陣 | 1986年 | 杜比立體聲(Dolby SR)減少了杜比SR降噪,以增強(qiáng)保真度和動態(tài)范圍。 | 帶C和MonoSurround矩陣的FL FR |
| / | 1987年 | 杜比立體聲和杜比環(huán)繞聲的參考有源矩陣2:4解碼器(Cat No. 150)。準(zhǔn)確解碼Lt ??/ Rt以恢復(fù)LCRS 4.0環(huán)繞聲。 | 帶C和MonoSurround矩陣的FL FR |
| AC-3 | 1992年電影 | 離散通道編碼器/解碼器。Pro Logic解碼器可用于縮混立體聲輸入。 | FL FR C SL SR SUB |
| AC-3 | 1999年 | 通過5.1中Ls / Rs通道的矩陣編碼進(jìn)行6.1或7.1環(huán)繞聲。向后兼容標(biāo)準(zhǔn)5.1數(shù)字。 | FL FR C SL SR(具有矩陣式RearMono)SUB [非離散7.1:BackLeft和BackRight] |
| 不適用 | 2000 | 將非編碼立體聲上混到Surround 5.1。也可用于解碼5.1播放的杜比環(huán)繞聲。消費(fèi)者解碼器通常包括特定的電影,音樂或游戲模式。 | FL FR C SL SR SUB |
| 不適用 | 2002年 | 擴(kuò)展至PLII。將立體聲,杜比環(huán)繞聲,杜比數(shù)字5.1增強(qiáng)到6.1或7.1。將杜比數(shù)字EX解碼為6.1或7.1。在消費(fèi)產(chǎn)品中保留電影,音樂或游戲模式。 | FL FR C SL SR SUB左后和右后 |
| 增強(qiáng)型AC-3 | 2005年 | 有損壓縮編解碼器;48 kHz采樣頻率,20位字長;支持32 kbit / s – 6 Mbit / s的數(shù)據(jù)速率,可擴(kuò)展,包括高清光盤上的768 kbit / s – 1.5 Mbit / s(通常),以及廣播和在線的256 kbit / s。當(dāng)前媒體應(yīng)用程序的1.0到7.1通道支持;可擴(kuò)展至16個通道;離散的。通過高達(dá)640 kbit / s的S / PDIF連接與杜比數(shù)字技術(shù)向后兼容。支持杜比元數(shù)據(jù)。 | FL FR C SL SR SUB左后和右后 |
| MLP | 2005年 | 無損壓縮編解碼器;支持高達(dá)4位字長的44.1 kHz至192 kHz采樣頻率;支持高達(dá)18 Mbit / s的可變數(shù)據(jù)速率。比Dolby Digital Plus更高的比特率。藍(lán)光光盤通道最多支持八個通道的96 kHz / 24位音頻;最高192 kHz / 24位的六個通道(5.1);?2至6通道支持最高192 kHz / 24位最大比特率,最高18 Mbit / s。 | / |
| 不適用 | 2009年 | 擴(kuò)展到PLIIx。加上前置高度通道,可將立體聲,杜比環(huán)繞聲或離散5.1 / 6.1 / 7.1解碼為7.1高度或完整9.1。 | L,C,R,Ls,Rs,Lrs(左后),Rrs(右后),LFE,Lvh和Rvh |
一、Dolby AC3
1、什么是AC3
AC3(Audio Code number 3),支持從單聲道到5.1聲道。它提供5個全帶寬聲道(3Hz~20000Hz),又稱為3/2配置,3個前置聲道(左、中、右),外加2個環(huán)繞聲道。除此之外,還有第六個重低音聲道(3Hz~120Hz),也稱為"低音增強(qiáng)聲道"(LFE)。因此,我們習(xí)慣把它稱為5.1聲道,其聲道分布如下圖所示:
2、AC3編碼原理
像MP3、AAC一樣,AC3利用聲音的掩蔽特性,使用改進(jìn)的離散余弦變換(MDCT)進(jìn)行壓縮。輸入的PCM采樣數(shù)據(jù)必須是32kHz、44.1kHz或者48kHz,而且是20bits。
AC3編碼如上圖所示包括采樣、量化、編碼,具體分為以下6個步驟:
? ? 1) 將音頻的表示從PCM時間樣本序列(時域)轉(zhuǎn)換為頻率系數(shù)塊序列(頻域),屬于有損壓縮。把512個時間樣本重疊塊乘以時間窗口,并且變換為頻域。由于塊重疊,每個PCM輸入樣本用兩個連續(xù)塊表示。然后頻域除以2,使得每個塊包含256個頻率系數(shù)。
? ? 2) 這組指數(shù)被編碼成信號頻譜,稱為頻譜包絡(luò)。
? ? 3) 核心位分配例程使用該頻譜包絡(luò),該例程決定使用多少位編碼每個尾數(shù)。
? ? 4) 尾數(shù)根據(jù)位分配信息來量化。
? ? 5) 將6個音頻塊(1536個音頻樣本)的頻譜包絡(luò)和量化尾數(shù)轉(zhuǎn)換為AC3幀。
? ? 6) AC3比特流(從32到640kbps)是AC3幀的序列。
3、AC3幀結(jié)構(gòu)
AC3幀包含:同步字、循環(huán)冗余校驗、采樣率、框碼、比特流識別、比特流模式、編碼方式、中心混合水平、環(huán)繞聲混合水平、環(huán)繞模式等字段,如下表所示:
| ? ? ? ? ? ?16 | ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?0x0B77,數(shù)據(jù)傳輸采用大端 |
| ? ? ? ? ? ?16 | |
| ? ? ? ? ? ? 2 | ? ? ? ? ? ? ? ? ? ? ? ?'11'=保留'10'= 32 kHz'01'= 44.1'00'= 48 |
| ? ? ? ? ? ? 6 | |
| ? ? ? ? ? ? 5 | |
| ? ? ? ? ? ? 3 | ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? '000'=主音頻服務(wù) |
| ? ? ? ? ? ? 3 | ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? '010'=左右聲道排序 |
| ? ? ? ? ? ? 2 | |
| ? ? ? ? ? ? 2 | |
| ? ? ? ? ? ? 2 | ? ? ? ? ? ? ? ? ? '00'=未表示'01'=未環(huán)繞編碼'10'=是,環(huán)繞編碼 |
4、AC3解碼過程
AC3解碼過程是編碼的逆過程,如下圖所示:
解碼流程如下圖所示:
二、Dolby AC3 Plus
AC3 Plus又稱為E-AC3,在AC3基礎(chǔ)上進(jìn)行改進(jìn)增強(qiáng)。支持更大范圍的碼率(32kb/s~6144kb/s),支持更多聲道。杜比數(shù)字(AC-3)支持多達(dá)五個全帶寬音頻聲道的最大比特率為640 kbit / s,E-AC-3支持多達(dá)15個全帶寬音頻通道,最大比特率為6.144Mb/s。
1、技術(shù)參數(shù)
E-AC3技術(shù)參數(shù)如下:
- 編碼比特率:0.032至6.144 Mbit / s
- 音頻聲道:1.0到15.1(即從單聲道到15個全音域通道和一個低頻聲道)
- 每個位流的音頻節(jié)目數(shù):8
- 采樣率:32、44.1或48 kHz
- 三、Dolby AC4
2、結(jié)構(gòu)
E-AC3由一個或多個子流組成,子流有三種類型:
- 獨(dú)立的子流,可包含多達(dá)5.1個頻道的單個節(jié)目。杜比數(shù)字+(Dolby Digital Plus)流中最多可以存在八個從屬子流。獨(dú)立子流中的聲道僅限于傳統(tǒng)的5.1聲道:左(L),右(R),中(C),左環(huán)繞(Ls)和右環(huán)繞(Rs)聲道,以及低頻效果(Lfe)聲道。
- 傳統(tǒng)子流包含單個5.1程序,直接對應(yīng)于杜比數(shù)字內(nèi)容。DD +流中最多只能有一個舊式子流。
- 從屬子流,其中包含傳統(tǒng)5.1通道以外的其他聲道。由于從屬子流具有與獨(dú)立子流相同的結(jié)構(gòu),因此每個從屬子流最多可包含五個全帶寬信道和一個低頻信道;但是,這些聲道可以分配給不同的揚(yáng)聲器位置。子流中的元數(shù)據(jù)描述了每個包含的聲道的用途。
3、語法
E-AC3是16位對齊的協(xié)議,其音頻流是固定長度同步幀數(shù)據(jù)包的集合,每個數(shù)據(jù)包都對應(yīng)于256、512、768或1536個連續(xù)的時域音頻樣本。(1536個樣本的情況是最常見的情況,對應(yīng)于杜比數(shù)字(Dolby Digital);較短的子幀長度旨在用于交互式應(yīng)用(如視頻游戲),其中減少編碼器延遲是一個重要問題。每個同步幀都是可獨(dú)立解碼的,并且屬于服務(wù)內(nèi)的特定子流。同步幀由以下語法元素組成:
- 一個16位同步字,其值為0x0b77。
- 比特流信息(BSI)部分,其中包括關(guān)鍵元數(shù)據(jù),例如幀大小,比特流標(biāo)識符(指定使用的語法的版本),通道模式,子流標(biāo)識符,編碼的對話級別(dialnorm)以及用于指導(dǎo)的元數(shù)據(jù)解碼器產(chǎn)生縮混。
- 音頻幀部分,包含同步幀中所有音頻塊共有的解碼信息,包括確定如何打包指數(shù)和尾數(shù)的必要信息。
- 一,二,三或六個音頻塊部分。這些部分包含其他解碼元數(shù)據(jù),以及編碼和量化的頻率系數(shù)。每個音頻塊對應(yīng)于每個通道中的256個PCM樣本。
- 最后一部分包含用戶定義的輔助數(shù)據(jù),產(chǎn)生統(tǒng)一同步幀長度的任何必要填充以及用于錯誤檢測的16位循環(huán)冗余校驗碼。
三、Dolby AC4
AC4可以包含音頻聲道和音頻對象,已經(jīng)被DVB(數(shù)字電視廣播)采用,并被ETSI標(biāo)準(zhǔn)化。AC4最多可具有5.1個核心音頻聲道,所有杜比AC4都需要對這些音頻聲道進(jìn)行解碼。其他音頻聲道可以被編碼為輔助信號,解碼器可以選擇支持這些附加信號,從而變成7.1聲道。其中低比特率使用高級聯(lián)合信號信道編碼(A-JCC),高比特率使用高級耦合(A-CPL)。A-JCC不支持輔助信號,并且僅限于5.1聲道音頻,而A-CPL支持輔助信號。與E-AC3相比,AC4的比特率降低了50%。
四、Dolby TrueHD
與AC3、E-AC3、AC4不同的是,Dolby TrueHD是無損壓縮,主要用于藍(lán)光光盤。杜比TrueHD提供多達(dá)16個離散音頻聲道,每個聲道的采樣率高達(dá)192kHz,采樣深度高達(dá)24位。TrueHD攜帶元數(shù)據(jù)用來修改其對音頻數(shù)據(jù)解析的非音頻信息,可以包括音頻規(guī)范化或動態(tài)范圍壓縮。
五、Dolby Atmos
Dolby Atmos杜比全景聲,通過增加高度聲道擴(kuò)展現(xiàn)有的環(huán)繞聲系統(tǒng),從而可以將聲音解析為三維對象。杜比全景聲允許將多達(dá)128個聲道分配給影院,以便根據(jù)影院的功能揚(yáng)聲器提供最佳的動態(tài)渲染。它可以在傳統(tǒng)的5.1和7.1布局上構(gòu)建。對于杜比全景聲,其命名稍有不同:7.1.4杜比全景聲,帶有四個頭頂式或啟用杜比全景聲的揚(yáng)聲器。
參考鏈接:
Dolby Digital:?https://en.wikipedia.org/wiki/Dolby_Digital
Dolby DIgital Plus:?https://en.wikipedia.org/wiki/Dolby_Digital_Plus
Dolby AC-4:?https://en.wikipedia.org/wiki/Dolby_AC-4
Dolby TrueHD:?https://en.wikipedia.org/wiki/Dolby_TrueHD
AC3協(xié)議:http://www.atsc.org/wp-content/uploads/2015/03/A52-201212-17.pdf
可以到GitHub一起學(xué)習(xí)音視頻:https://github.com/xufuji456/FFmpegAndroid???????
總結(jié)
以上是生活随笔為你收集整理的走进音视频的世界——杜比音效之AC3与AC4的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 电阻(电阻器)总结
- 下一篇: electron build报错,nsi