日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > windows >内容正文

windows

第1章 音频系统

發(fā)布時(shí)間:2024/1/1 windows 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 第1章 音频系统 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

轉(zhuǎn)載請(qǐng)注明:LXS, http://blog.csdn.net/uiop78uiop78/article/details/8787779

?

對(duì)于一部嵌入式設(shè)備來說,除了若干基礎(chǔ)功能外(比如手機(jī)通話、短信),最重要的可能就是多媒體了——那么一個(gè)最簡(jiǎn)單的問題,什么是多媒體呢?

這個(gè)術(shù)語對(duì)應(yīng)的英文單詞是“Multi-Media”,直譯過來就是多媒體。名稱就很好地解釋了它的含義,我們引用Wikipedia上對(duì)其的詳細(xì)定義:

Multimedia is media and content that uses a combination of differentcontent forms. This contrasts with media that use only rudimentary computerdisplays such as text-only or traditional forms of printed or hand-producedmaterial. Multimedia includes a combination of text, audio, still images,animation, video, or interactivity content forms.

換句話說,多媒體是各種形式的媒體(比如文本、音頻、視頻、圖片、動(dòng)畫等等)的組合。可以說,它是一款產(chǎn)品能否在眾多“同質(zhì)化”嚴(yán)重的市場(chǎng)上脫穎而出的關(guān)鍵。另外,由于不同的產(chǎn)品在音頻處理、視頻解碼等芯片方面或多或少都存在差異,原生態(tài)的Android系統(tǒng)不可能覆蓋市面上的所有硬件方案,所以這部分功能的移植與二次開發(fā)就成了設(shè)備研發(fā)中的重頭戲——當(dāng)然,Android系統(tǒng)在設(shè)計(jì)之初就充分考慮到了這點(diǎn),它提供了一整套靈活的多媒體解決方案,以應(yīng)對(duì)廠商的定制化需求。

對(duì)于應(yīng)用開發(fā)人員來說,最熟悉最常用的就是MediaPlayer和MediaRecorder,而深藏在這兩個(gè)類之間的實(shí)現(xiàn)細(xì)節(jié)卻鮮有人知。這也是Android的一大優(yōu)點(diǎn)——高度封裝,讓各類開發(fā)人員可以把精力放在自己“需要做的事情上”,各司其職,細(xì)化分工,從而極大的提高了產(chǎn)品的開發(fā)效率。

不過,這種封裝也同時(shí)帶來了一些代價(jià)。比如系統(tǒng)異常龐大,各種類定義、C++庫(kù)、Java封裝等等讓人目不暇接,這給我們剖析多媒體系統(tǒng)帶來了不少障礙。為此,我們特別選取其中的音頻實(shí)現(xiàn)(其中大部分又以音頻回放為主),通過有重點(diǎn)、深入的分析音頻系統(tǒng)的實(shí)現(xiàn),來為大家學(xué)習(xí)Android多媒體系統(tǒng)打開一個(gè)缺口。

本章的內(nèi)容編排是由下而上的,即從最底層的基礎(chǔ)知識(shí)、框架實(shí)現(xiàn)講起,再逐步擴(kuò)展延伸到上層應(yīng)用

·????????音頻的基礎(chǔ)知識(shí)

理解音頻的一些基礎(chǔ)知識(shí),對(duì)于我們分析整個(gè)音頻系統(tǒng)是大有裨益的。它可以讓我們從實(shí)現(xiàn)的層面去思考,音頻系統(tǒng)的目的是什么,然后才是怎么樣去完成這個(gè)目的

·????????AudioFlinger、AudioPolicyService和AudioTrack/AudioRecorder

拋開MediaPlayer、MediaRecorder這些與應(yīng)用開發(fā)直接關(guān)聯(lián)的部分,整個(gè)音頻系統(tǒng)的核心就是由這三者構(gòu)建而成的。其中前兩個(gè)都是System Service,駐留在mediaserver進(jìn)程中,不斷地處理AudioTrack/AudioRecorder的請(qǐng)求。音頻的回放和錄制從大的流程上看都是相似的,所以我們側(cè)重于對(duì)AudioTrack的分析

·????????音頻的數(shù)據(jù)流

數(shù)據(jù)流處理是音頻系統(tǒng)管理的一大重點(diǎn)和難點(diǎn),至少有如下幾點(diǎn)是需要充分考慮的:

??如何決定音頻流的路徑

通常一臺(tái)設(shè)備會(huì)有多種音頻設(shè)備,而且同一時(shí)間內(nèi)系統(tǒng)也很可能會(huì)播放多種音頻,我們需要將這些音頻流與對(duì)應(yīng)的設(shè)備建立關(guān)聯(lián),并做好全局管理

??如何保證音頻流以有效的速度傳輸?shù)揭纛l設(shè)備

顯然,數(shù)據(jù)太快或者太慢都會(huì)是缺陷

??跨進(jìn)程的數(shù)據(jù)傳遞

舉個(gè)例子,從Apk應(yīng)用程序創(chuàng)建一個(gè)MediaPlayer,到音頻真正從設(shè)備中回放出來,這個(gè)過程涉及到多個(gè)進(jìn)程間的通信,如何在這些進(jìn)程間做好數(shù)據(jù)傳遞,也是我們所關(guān)心的

·????????音頻系統(tǒng)的上層建筑

在理解了音頻系統(tǒng)的實(shí)現(xiàn)核心后,我們?cè)購(gòu)纳蠈討?yīng)用的角度來思考,相信會(huì)有不一樣的收獲

?

1.1 音頻基礎(chǔ)

1.1.1 聲波

從物理學(xué)的角度來說,聲波是機(jī)械波的一種。

機(jī)械波(MechanicalWave)是由機(jī)械振蕩產(chǎn)生的,它的傳播需要介質(zhì)的支持。它有如下特點(diǎn):

l?介質(zhì)本身并不會(huì)隨著機(jī)械波不斷地前進(jìn)

比如我們抖動(dòng)一條繩子產(chǎn)生的繩波,繩子上的某個(gè)點(diǎn)只是在一定范圍內(nèi)做上下運(yùn)動(dòng),沒有因?yàn)椴ǖ膫鬟f而脫離繩子。因而機(jī)械波是能量的傳遞,而不是質(zhì)量的傳遞

l?在不同的介質(zhì)中,傳播速度是不一樣的

?

那么,作為機(jī)械波的一種,聲音有哪些重要屬性呢?

l?響度(Loudness)

響度就是人類可以感知到的各種聲音的大小,也就是音量。響度與聲波的振幅有直接關(guān)系——理論上振幅越大,響度也就越大

l?音調(diào)(Pitch)

我們常說某人唱高音很好,或者低音很棒,這就是音調(diào)。音調(diào)與聲音的頻率有關(guān)系——當(dāng)聲音的頻率越大時(shí),人耳所感知到的音調(diào)就越高,否則就越低

l?音色(Quality)

同一種樂器,使用不同的材質(zhì)來制作,所表現(xiàn)出來的音色效果是不一樣的,這是由物體本身的結(jié)構(gòu)特性所決定的——它直接影響了聲音的音色屬性。同樣的道理,不同的演唱者因?yàn)樗麄兊陌l(fā)聲部位有差異,所以才造就了更種嗓音特色的音樂才子

?

聲音的這幾個(gè)屬性,是所有音頻效果處理的基礎(chǔ)。任何對(duì)音頻的調(diào)整都將反應(yīng)到這些屬性上,在我們分析源碼時(shí)可以結(jié)合起來思考。

1.1.2 音頻的錄制、存儲(chǔ)與回放

上面的多媒體定義還從側(cè)面反映出一個(gè)結(jié)論,即Multi-Media并不是專門為計(jì)算機(jī)而生的——只不過后者的出現(xiàn)極大地推動(dòng)了它的發(fā)展。那么和傳統(tǒng)的多媒體相比,計(jì)算機(jī)領(lǐng)域的多媒體系統(tǒng),會(huì)有哪些區(qū)別呢?

一個(gè)很顯然的問題是,我們?nèi)绾螌⒏鞣N媒體源數(shù)字化呢?比如,早期的音頻信息是存儲(chǔ)在錄音帶中的,以模擬信號(hào)的形式存儲(chǔ)。而到了計(jì)算機(jī)時(shí)代,這些音頻數(shù)據(jù)必須通過一定的處理手段才可能存儲(chǔ)到設(shè)備中,這是我們?cè)跀?shù)字化時(shí)代會(huì)遇到的一個(gè)常見問題。下面這個(gè)圖很好地描述了音頻從錄制到播放的一系列操作流程:

?

圖 13?1 音頻的錄制、存儲(chǔ)和回放

引用自http://en.wikipedia.org/wiki/File:A-D-A_Flow.svg

?

錄制過程

·????????首先,音頻采集設(shè)備(比如Microphone)捕獲聲音信息,初始數(shù)據(jù)是模擬信號(hào)

·????????模擬信號(hào)通過模-數(shù)轉(zhuǎn)換器(ADC)處理成計(jì)算機(jī)能接受的二進(jìn)制數(shù)據(jù)

·????????上一步得到的數(shù)據(jù)根據(jù)需求進(jìn)行必要的渲染處理,比如音效調(diào)整、過濾等等

·????????處理后的音頻數(shù)據(jù)理論上已經(jīng)可以存儲(chǔ)到計(jì)算機(jī)設(shè)備中了,比如硬盤、USB設(shè)備等等。不過由于這時(shí)的音頻數(shù)據(jù)體積相對(duì)龐大,不利于保存和傳輸,通常還會(huì)對(duì)其進(jìn)行壓縮處理。比如我們常見的mp3音樂,實(shí)際上就是對(duì)原始數(shù)據(jù)采用相應(yīng)的壓縮算法后得到的。壓縮過程根據(jù)采樣率、位深等因素的不同,最終得到的音頻文件可能會(huì)有一定程度的失真

另外,音視頻的編解碼既可以由純軟件完成,也同樣可以借助于專門的硬件芯片來完成

?

回放過程

回放過程總體上是錄制過程的逆向操作。

l?從存儲(chǔ)設(shè)備中取出相關(guān)文件,并根據(jù)錄制過程采用的編碼方式進(jìn)行相應(yīng)的解碼

l?音頻系統(tǒng)為這一播放實(shí)例選定最終匹配的音頻回放設(shè)備

l?解碼后的數(shù)據(jù)經(jīng)過音頻系統(tǒng)設(shè)計(jì)的路徑傳輸

l?音頻數(shù)據(jù)信號(hào)通過數(shù)模轉(zhuǎn)換器(DAC)變換成模擬信號(hào)

l?模擬信號(hào)經(jīng)過回放設(shè)備,還原出原始聲音

?

本章著重講解的是音頻“回放過程”。

1.1.3 音頻采樣

前面我們說過,數(shù)字音頻系統(tǒng)需要將聲波波形信號(hào)通過ADC轉(zhuǎn)換成計(jì)算機(jī)支持的二進(jìn)制,進(jìn)而保存成音頻文件,這一過程叫做音頻采樣(Audio Sampling)。音頻采樣是眾多數(shù)字信號(hào)處理的一種,它們的基本原理都是類似的(比如視頻的采樣和音頻采樣本質(zhì)上也沒有太大區(qū)別)。

可想而知,采樣(Sampling)的核心是把連續(xù)的模擬信號(hào)轉(zhuǎn)換成離散的數(shù)字信號(hào)。它涉及到如下幾點(diǎn):

l?樣本(Sample)

這是我們進(jìn)行采樣的初始資料,比如一段連續(xù)的聲音波形

l?采樣器(Sampler)

采樣器是將樣本轉(zhuǎn)換成終態(tài)信號(hào)的關(guān)鍵。它可以是一個(gè)子系統(tǒng),也可以指一個(gè)操作過程,甚至是一個(gè)算法,取決于不同的信號(hào)處理場(chǎng)景。理想的采樣器要求盡可能不產(chǎn)生信號(hào)失真

l?量化(Quantization)

采樣后的值還需要通過量化,也就是將連續(xù)值近似為某個(gè)范圍內(nèi)有限多個(gè)離散值的處理過程。因?yàn)樵紨?shù)據(jù)是模擬的連續(xù)信號(hào),而數(shù)字信號(hào)則是離散的,它的表達(dá)范圍是有限的,所以量化是必不可少的一個(gè)步驟

l?編碼(Coding)

計(jì)算機(jī)的世界里,所有數(shù)值都是用二進(jìn)制表示的,因而我們還需要把量化值進(jìn)行二進(jìn)制編碼。這一步通常與量化同時(shí)進(jìn)行

?

整個(gè)流程如下圖所示:

?圖 13?2? PCM流程

?

PCM(Pulse-code modulation)俗稱脈沖編碼調(diào)制,是將模擬信號(hào)數(shù)字化的一種經(jīng)典方式,得到了非常廣泛的應(yīng)用。比如數(shù)字音頻在計(jì)算機(jī)、DVD以及數(shù)字電話等系統(tǒng)中的標(biāo)準(zhǔn)格式采用的就是PCM。它的基本原理就是我們上面的幾個(gè)流程,即對(duì)原始模擬信號(hào)進(jìn)行抽樣、量化和編碼,從而產(chǎn)生PCM流。另外,我們可以調(diào)整PCM的以下屬性來達(dá)到不同的采樣需求:

l?采樣速率(Sampling Rate)

在將連續(xù)信號(hào)轉(zhuǎn)化成離散信號(hào)時(shí),就涉及到采樣周期的選擇。如果采樣周期太長(zhǎng),雖然文件大小得到控制,但采樣后得到的信息很可能無法準(zhǔn)確表達(dá)原始信息;反之,如果采樣的頻率過快,則最終產(chǎn)生的數(shù)據(jù)量會(huì)大幅增加,這兩種情況都是我們不愿意看到的,因而需要根據(jù)實(shí)際情況來選擇合適的采樣速率。

由于人耳所能辨識(shí)的聲音范圍是20-20KHZ,所以人們一般都選用44.1KHZ(CD)、48KHZ或者96KHZ來做為采樣速率

l?采樣深度(Bit Depth)

我們知道量化(Quantization)是將連續(xù)值近似為某個(gè)范圍內(nèi)有限多個(gè)離散值的處理過程。那么這個(gè)范圍的寬度以及可用離散值的數(shù)量會(huì)直接影響到音頻采樣的準(zhǔn)確性,這就是采樣深度的意義

?

圖 13?3 采用4-bit深度的PCM,引自Wikipedia

?

比如上圖是一個(gè)采用4位深度進(jìn)行量化得到的PCM。因?yàn)?bit最多只能表達(dá)16個(gè)數(shù)值(0-15),所以圖中最終量化后的數(shù)值依次為7、9、11、12、13、14、15等等。這樣的結(jié)果顯然是相對(duì)粗糙的,存在一定程度的失真。當(dāng)位深越大,所能表達(dá)的數(shù)值范圍越廣,上圖中縱坐標(biāo)的劃分也就越細(xì)致,從而使得量化的值越接近原始數(shù)據(jù)。

1.1.4 Nyquist–Shannon采樣定律

由Harry Nyquist和Claude Shannon總結(jié)出來的采樣規(guī)律,為我們選擇合適的采樣頻率提供了理論依據(jù)。這個(gè)規(guī)律又被稱為“Nyquist sampling theorem”或者“The sampling theorem”,中文通常譯為“奈奎斯特采樣理論”。它的中心思想是:

“當(dāng)對(duì)被采樣的模擬信號(hào)進(jìn)行還原時(shí),其最高頻率只有采樣頻率的一半”。

換句話說,如果我們要完整重構(gòu)原始的模擬信號(hào),則采樣頻率就必須是它的兩倍以上。比如人的聲音范圍是20-20kHZ,那么選擇的采樣頻率就應(yīng)該在40kHZ左右,數(shù)值太小則聲音將產(chǎn)生失真現(xiàn)象,而數(shù)值太大也無法明顯提升人耳所能感知的音質(zhì)。

1.1.5 聲道和立體聲

我們?cè)谌粘I钪袝?huì)經(jīng)常聽到單聲道、雙聲道這些專業(yè)詞語,那么它們代表什么意思呢?

一個(gè)聲道(AudioChannel),簡(jiǎn)單來講就代表了一種獨(dú)立的音頻信號(hào),所以雙聲道理論上就是兩種獨(dú)立音頻信號(hào)的混合。具體而言,如果我們?cè)阡浿坡曇魰r(shí)在不同空間位置放置兩套采集設(shè)備(或者一套設(shè)備多個(gè)采集頭),就可以錄制兩個(gè)聲道的音頻數(shù)據(jù)了。后期對(duì)采集到的聲音進(jìn)行回放時(shí),通過與錄制時(shí)相同數(shù)量的外放揚(yáng)聲器來分別播放各聲道的音頻,就可以盡可能還原出錄制現(xiàn)場(chǎng)的真實(shí)聲音了。

聲道的數(shù)量發(fā)展經(jīng)歷了幾個(gè)重要階段,分別是:

l?Monaural (單聲道)

早期的音頻錄制是單聲道的,它只記錄一種音源,所以在處理上相對(duì)簡(jiǎn)單。播放時(shí)理論上也只要一個(gè)揚(yáng)聲器就可以了——即便有多個(gè)揚(yáng)聲器,它們的信號(hào)源也是一樣的,起不到很好的效果

l?Stereophonic(立體聲)

之所以稱為立體聲,是因?yàn)槿藗兛梢愿惺艿铰曇羲a(chǎn)生的空間感。大自然中的聲音就是立體的,比如辦公室里鍵盤敲擊聲,馬路上汽車?guó)Q笛,人們的說話聲等等。那么這些聲音為什么會(huì)產(chǎn)生立體感呢?

我們知道,當(dāng)音源發(fā)聲后(比如你右前方有人在講話),音頻信號(hào)將分別先后到達(dá)人類的雙耳。在這個(gè)場(chǎng)景中,是先傳遞到右耳然后左耳,并且右邊的聲音比左邊稍強(qiáng)。這種細(xì)微的差別通過大腦處理后,我們就可以判斷出聲源的方位了。

這個(gè)原理現(xiàn)在被應(yīng)用到了多種場(chǎng)合。在音樂會(huì)的錄制現(xiàn)場(chǎng),如果我們只使用單聲道采集,那么后期回放時(shí)所有的音樂器材都會(huì)從一個(gè)點(diǎn)出來;反之,如果能把現(xiàn)場(chǎng)各方位的聲音單獨(dú)記錄下來,并在播放時(shí)模擬當(dāng)時(shí)的場(chǎng)景,那么就可以營(yíng)造出音樂會(huì)的逼真氛圍。

為了加深大家的理解,我們特別從某雙聲道音頻文件中提取出它的波形:

?

圖 13?4 雙聲道音頻文件

?

順便以這個(gè)圖為例子再說一下音頻的采樣頻率。我們把上圖進(jìn)行放大,如下所示:

?

圖 13?5 采樣頻率實(shí)例

?

圖上共有三個(gè)采樣點(diǎn),時(shí)間間隔是從4:26.790863到4:26.790908左右,也就是說在大約0.000045秒的時(shí)間里采集了兩個(gè)點(diǎn),因而采樣頻率就是:

1/(0.000045/2)=44kHZ,這和此音頻文件所標(biāo)記的采樣率是一致的

l?4.1 Surround Sound(4.1環(huán)繞立體聲)

隨著技術(shù)的發(fā)展和人們認(rèn)知的提高,單純的雙聲道已不能滿足需求了,于是更多的聲道數(shù)逐漸成為主流,其中被廣泛采用的就有四聲道環(huán)繞立體聲。

其中的“4”代表了四個(gè)音源,位置分別是前左(Front-Left)、前右(Front-Right)、后左(Rear-Left)、后右(Rear-Right)。而小數(shù)點(diǎn)后面的1,則代表了一個(gè)低音喇叭(Subwoofer),專門用于加強(qiáng)低頻信號(hào)效果

l?5.1 Surround Sound(5.1環(huán)繞立體聲)

相信大家都聽過杜比數(shù)字技術(shù),這是眾多5.1環(huán)繞聲中的典型代表。另外還有比如DTS、SDDS等都屬于5.1技術(shù)。5.1相對(duì)于4.1多了一個(gè)聲道,位置排列分別是前左、前右、中置(Center Channel)和兩個(gè)Surround Channel,外加一個(gè)低音喇叭。

根據(jù)ITU(InternationalTelecommunication Union)的建議,5.1環(huán)繞技術(shù)各揚(yáng)聲器位置圖如下所示:

?

圖 13?6? ITU發(fā)布的5.1環(huán)繞技術(shù)推薦方位圖

?

即:

l?各揚(yáng)聲器和聽者距離是一致的,因而組成一個(gè)圓形

l?角度分布:前左和前右分別是+22.5/-22.5度(看電影時(shí)),以及+30/-30度(聽音樂時(shí));中置總是為0度;后面的兩個(gè)環(huán)繞器分別為+110/-110度

1.1.6 Weber–Fechner law

估計(jì)知道這個(gè)定律的人比較少,它是音頻系統(tǒng)中計(jì)算聲音大小的一個(gè)重要依據(jù)。從嚴(yán)格意義上講,它并不只適用于聲音感知,而是人體各種感觀(聽覺、視覺、觸覺)與刺激物理量之間的一條綜合規(guī)律。其中心思想用公式表達(dá)就是:

△I/I=C

其中△I表示差別閾值,I是原先的刺激量,而C則是常量。換句話說,就是能引起感觀變化的刺激差別量與原先的刺激量比值是固定的。這樣子說可能比較抽象,我們舉個(gè)例子來說。

場(chǎng)合1. 去商店買一瓶水,原本2塊錢的東西賣到了5塊錢

場(chǎng)合2. 買一輛奔馳車,原先價(jià)格是一百萬,現(xiàn)在漲了3塊錢

這兩種場(chǎng)景下,前后的價(jià)格雖然都是相差3元,但對(duì)我們?cè)斐傻闹饔^感受是有很大不同的。顯然在第一種情況下,我們會(huì)覺得很貴而可能選擇不買;而后者則對(duì)我們基本不會(huì)產(chǎn)生任何影響。這是因?yàn)橐鸶杏^變化的刺激量并不單單取決于前后變化量的絕對(duì)差值,同時(shí)也與原來的刺激量有很大關(guān)系。對(duì)于特定的場(chǎng)合,上述公式中的C值是固定的。比如有的人覺得2塊錢的東西賣3元就是貴了,有的人則能接受2塊錢的東西賣4塊,對(duì)于不同的人C值是會(huì)有差異的。

這就是德國(guó)心理物理學(xué)家ErnstHeinrich Weber發(fā)現(xiàn)的規(guī)律,后來的學(xué)生GustavFechner把這一發(fā)現(xiàn)系統(tǒng)地用公式表達(dá)出來,就是上述公式所表達(dá)的韋伯定律。

后來,Fechner在此基礎(chǔ)上又做了改進(jìn)。他提出刺激量和感知是呈對(duì)數(shù)關(guān)系的,即當(dāng)刺激強(qiáng)度以幾何級(jí)數(shù)增長(zhǎng)時(shí),感知強(qiáng)度則以算術(shù)級(jí)數(shù)增加。這就是Weber–Fechner law,如下公式所示:

S?=?C?log?R

那么這對(duì)音頻系統(tǒng)有什么指導(dǎo)意義呢?

我們知道,系統(tǒng)音量是可調(diào)的,比如分為0-20個(gè)等級(jí)。這些等級(jí)又分別對(duì)應(yīng)不同的輸出電平值,那么我們?nèi)绾未_定每一個(gè)等級(jí)下應(yīng)該設(shè)置的具體電平值呢?你可能會(huì)想到平均分配。沒錯(cuò),這的確是一種方法,只不過按照這樣的算法所輸出的音頻效果在用戶聽來并不是最佳的,因?yàn)槁曇舻淖兓贿B續(xù)。

一個(gè)更好的方案就是遵循Weber–Fechnerlaw,而采用對(duì)數(shù)的方法。在Android系統(tǒng)中,這一部分計(jì)算具體的實(shí)現(xiàn)代碼在audiosystem.cpp文件中,大家有興趣的話可以自行閱讀了解下。

1.1.7 音頻的幾種文件格式

前面小節(jié)我們分析了音頻采樣的基本過程,它將連續(xù)的聲音波形轉(zhuǎn)換成為若干范圍內(nèi)的離散數(shù)值,從而將音頻數(shù)據(jù)用二進(jìn)制的形式在計(jì)算機(jī)系統(tǒng)中表示。不過音頻的處理并沒有結(jié)束,我們通常還需要對(duì)上述過程產(chǎn)生的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)化,然后才最終存儲(chǔ)到設(shè)備中。

要特別注意文件格式(FileFormat)和文件編碼器(Codec)的區(qū)別。編碼器負(fù)責(zé)將原始數(shù)據(jù)進(jìn)行一定的前期處理,比如壓縮算法以減小體積,然后才以某種特定的文件格式進(jìn)行保存。Codec和File Format不一定是一對(duì)一的關(guān)系,比如常見的AVI就支持多種音頻和視頻編碼方式。本小節(jié)所講述的以文件格式為主。

我們把數(shù)字音頻格式分為以下幾種:

l? 不壓縮的格式(UnCompressed Audio Format)

比如前面所提到的PCM數(shù)據(jù),就是采樣后得到的未經(jīng)壓縮的數(shù)據(jù)。PCM數(shù)據(jù)在Windows和Mac系統(tǒng)上通常分別以wav和aiff后綴進(jìn)行存儲(chǔ)。可想而知,這樣的文件大小是比較可觀的

l?無損壓縮格式(Lossless Compressed Audio Format)

這種壓縮的前提是不破壞音頻信息,也就是說后期可以完整還原出原始數(shù)據(jù)。同時(shí)它在一定程度上可以減小文件體積。比如FLAC、APE(Monkey’sAudio)、WV(WavPack)、m4a(Apple Lossless)等等

l?有損壓縮格式(Lossy Compressed Audio Format)

無損壓縮技術(shù)能減小的文件體積相對(duì)有限,因而在滿足一定音質(zhì)要求的情況下,我們還可以進(jìn)行有損壓縮。其中最為人熟知的當(dāng)然是mp3格式,另外還有iTunes上使用的AAC,這些格式通常可以指定壓縮的比率——比率越大,文件體積越小,但效果也越差

?

至于采用哪一種格式,通常要視具體的使用場(chǎng)景而定。

?

版權(quán)聲明:本文為博主原創(chuàng)文章,未經(jīng)博主允許不得轉(zhuǎn)載。

轉(zhuǎn)載于:https://www.cnblogs.com/senior-engineer/p/4977392.html

總結(jié)

以上是生活随笔為你收集整理的第1章 音频系统的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。