I2S音頻總線學習?(一)數字音頻技術?一、聲音的基本概念?? ? 聲音是通過一定介質傳播的連續的波。
圖1 聲波 重要指標: - 振幅:音量的大小
- 周期:重復出現的時間間隔
- 頻率:指信號每秒鐘變化的次數
聲音按頻率分類:
圖2 聲音的頻率(語音信號頻率范圍:300Hz-3kHz) 聲音的傳播攜帶了信息,它是人類傳播信息的一種主要媒體。 聲音的三種類型: - 波形聲音:包含了所有聲音形式
- 語音:不僅是波形聲音,而且還有豐富的語言內涵(抽象→提取特征→意義理解)
- 音樂:與語音相比,形式更規范。音樂是符號化的聲音。
二、聲音的數字化?1.聲音信號的類型 2.聲音數字化過程? 圖3 聲音數字化過程 3.聲音數字化過程示意圖? 圖4 聲音數字化過程示意圖 4.聲音數字化三要素 | 采樣頻率 | ? | 量化位數 | 聲道數 | | 每秒鐘抽取聲波幅度樣本的次數 | ? | 每個采樣點用多少二進制位表示數據范圍 | 使用聲音通道的個數 | 采樣頻率越高 聲音質量越好 數據量也越大 | ? | 量化位數越多 音質越好 數據量也越大 | 立體聲比單聲道的表現力豐富,但數據量翻倍 | 11.025kHz 22.05 kHz 44.1??kHz | ? | 8位=256 16位=65536 | 單聲道 立體聲 | 5.聲音數字化的數據量?音頻數據量=采樣頻率×量化位數×聲道數/8(字節/秒) 采樣頻率 (kHz) | 量化位數 (bit) | 數據量(KB/s) | | 單聲道 | 立體聲 | | 11.025 | 8 | 10.77 | 21.35 | | 16 | 21.53 | 43.07 | | 22.05 | 8 | 21.53 | 43.07 | | 16 | 43.07 | 86.13 | | 44.1 | 8 | 43.07 | 86.13 | | 16 | 86.13 | 172.27 |
三、音頻的文件格式?1.WAV文件?WAV是Microsoft/IBM共同開發的PC波形文件。因未經壓縮,文件數據量很大。 特點:聲音層次豐富,還原音質好 2.MP3文件?MP3(MPEG Audio layer3)是一種按MPEG標準的音頻壓縮技術制作的音頻文件。 特點:高壓縮比(11:1),優美音質 3.WMA文件?WMA(Windows Media Audio)是Windows Media格式中的一個子集(音頻格式)。 特點:壓縮到MP3一半 4.MIDI文件?MIDI(樂器數字接口)是由一組聲音或樂器符號的集合。 特點:數據量很小,缺乏重現自然音 四、數字音頻壓縮標準?1.音頻壓縮方法概述?[img=734,71][/img] 圖5 壓縮編碼技術是指用某種方法使數字化信息的編碼率降低的技術 音頻信號能壓縮的基本依據:?①聲音信號中存在大量的冗余度; ②人的聽覺具有強音能抑制同時存在的弱音現象。 音頻信號壓縮編碼的分類:?①無損壓縮(熵編碼) 霍夫曼編碼、算術編碼、行程編碼 ②有損壓縮 波形編碼--PCM、DPCM、ADPCM 、子帶編碼、矢量量化 參數編碼--LPC 混合編碼--MPLPC、CELP 2.音頻壓縮技術標準 | 分類 | 標準 | 說明 | 電話語 音質量 | G.711 | 采樣8kHz,量化8bit,碼率64kbps | | G.721 | 采用ADPCM編碼,碼率32kbps | | G.723 | 采用ADPCM有損壓縮,碼率24kbps | | G.728 | 采用LD-CELP壓縮技術,碼率16kbps | 調幅廣 播質量 | G.722 | 采樣16kHz,量化14bit,碼率224(64)kbps | 高保真 立體聲 | MPEG 音頻 | 采樣44.1kHz,量化16bit,碼率705kbps (MPEG三個壓縮層次,384-64kbps) | 五、聲卡?1.聲卡的主要功能?聲卡是負責錄音、播音和聲音合成的一種多媒體板卡。其功能包括: ①錄制、編輯和回放數字音頻文件 ②控制和混合各聲源的音量 ③記錄和回放時進行壓縮和解壓縮 ④語音合成技術(朗讀文本) ⑤具有MIDI接口(樂器數字接口)?2.芯片類型 (二)I2S總線協議?一、I2S總線概述?? ?? ?? ?音響數據的采集、處理和傳輸是多媒體技術的重要組成部分。眾多的數字音頻系統已經進入消費市場,例如數字音頻錄音帶、數字聲音處理器。對于設備和生產廠家 來說,標準化的信息傳輸結構可以提高系統的適應性。I2S(Inter—IC??Sound)總線是飛利浦公司為數字音頻設備之間的音頻數據傳輸而制定的一種總線標準,該總線專責于音頻設備之間的數據傳輸,廣泛應用于各種多媒體系統。 二、I2S總線規范?I2S總線擁有三條數據信號線: 1、SCK: (continuous serial clock)??串行時鐘?? ?? ?? ?對應數字音頻的每一位數據,SCK都有1個脈沖。SCK的頻率=2×采樣頻率×采樣位數。 2、WS: (word select)??字段(聲道)選擇?? ?? ?? ?用于切換左右聲道的數據。WS的頻率=采樣頻率。 ? ?? ?? ?命令選擇線表明了正在被傳輸的聲道。 ? ?? ?? ?WS為“1”表示正在傳輸的是左聲道的數據。 ? ?? ?? ?WS為“0”表示正在傳輸的是右聲道的數據。 ? ?? ?? ?WS可以在串行時鐘的上升沿或者下降沿發生改變,并且WS信號不需要一定是對稱的。在從屬裝置端,WS在時鐘信號的上升沿發生改變。WS總是在最高位傳輸 前的一個時鐘周期發生改變,這樣可以使從屬裝置得到與被傳輸的串行數據同步的時間,并且使接收端存儲當前的命令以及為下次的命令清除空間。 3、SD: (serial data)??串行數據?? ?? ?? ?用二進制補碼表示的音頻數據。 I2S 格式的信號無論有多少位有效數據,數據的最高位總是被最先傳輸(在WS變化(也就是一幀開始)后的第2個SCK脈沖處),因此最高位擁有固定的位置,而最 低位的位置則是依賴于數據的有效位數。也就使得接收端與發送端的有效位數可以不同。如果接收端能處理的有效位數少于發送端,可以放棄數據幀中多余的低位數 據;如果接收端能處理的有效位數多于發送端,可以自行補足剩余的位(常補足為零)。這種同步機制使得數字音頻設備的互連更加方便,而且不會造成數據錯位。 為了保證數字音頻信號的正確傳輸,發送端和接收端應該采用相同的數據格式和長度。當然,對I2S格式來說數據長度可以不同。 對于系統而言,產生SCK和WS的信號端就是主設備,用MASTER表示,簡單系統示意圖如圖1所示:? ?? ?
圖1 簡單系統配置和基本接口時序
? ?? ? 另一個基本的接口時序圖可以參看圖2所示:??
圖2 I2S典型的接口時序 ? 4、時序要求?? ?? ???在IIS總線中,任何設備都可以通過提供必需的時鐘信號成為系統的主設備置,而從屬設備通過外部時鐘信號來得到它的內部時鐘信號,這就意味著必須重視主設備和數據以及命令選擇信號之間的傳播延遲,總的延遲主要由兩部分組成: 1.外部時鐘和從設備的內部時鐘之間的延遲 2.內部時鐘和數據信號以及命令選擇信號之間的延遲 ? ?? ???對于數據和命令信號的輸入,外部時鐘和內部時的延遲不占據主導的地位,它只是延長了有效的建立時間(set-up time)。延遲的主要部分是發送端的傳輸延遲和設置接收端所需的時間。見圖3和圖4:
圖3 Timing for IIS Transmitter
圖4??Timing for IIS Receiver 其中:
T是時鐘周期,Tr是最小允許時鐘周期,T>Tr這樣發送端和接收端才能滿足數據傳輸速率的要求。 對于所有的數據速率,發送端和接收端均發出一個具有固定的傳號空號比(mark—space ratio)的時鐘信號,所以t LC和tHC是由T所定義的。 t LC和tHC必須大于0.35T,這樣信號在從屬裝置端就可以被檢測到。 延遲(tdtr)和最快的傳輸速度(由Ttr定義)是相關的,快的發送端信號在慢的時鐘上升沿可能導致tdtr不能超過tRC而使thtr為零或者負。只有tRC不大于tRCmax的時候(tRCmax>:0.15T),發送端才能保證thtr大于等于0。 為了允許數據在下降沿被記錄,時鐘信號上升沿及T相關的時間延遲應該給予接收端充分的建立時間(set-up time)。 數據建立時間(set-up time)和保持時間(hold time)不能小于指定接收端的建立時間和保持時間。
5、電氣特性?輸出電壓: ? ?? ???VL <0.4V? ??? ? ?? ?? ?? ?VH>2.4V 輸入電壓 ? ?? ?? ?VIL=0.8V? ? ? ?? ?? ?? ? VIH=2.0V 注:目前使用的TTL電平標準,隨著其他IC(LSI)的流行,其他電平也會支持。?? I2S(InterIC Sound Bus)是飛利浦公司針對數字音頻設備之間的音頻數據傳輸而制定的一種總線標準,采用沿獨立的導線傳輸時鐘與數據信號的設計,通過分離數據和時鐘信號,避免了時差誘發的失真。I2S總線簡單有效,可以有效提升輸出數據的質量,在各種嵌入式音頻系統中有廣泛應用。但是在嵌入式音頻系統設計中,并不是所有的MCU都支持I2S總線格式,再加上I2S還沒有統一的接口標準,不同的廠家生產的設備接口也是五花八門,采用軟件模擬實現I2S總線可有效解決在不支持其的MCU和設備之間通過I2S總線實現數據傳輸時出現的問題。 本文通過在以太網數字語音廣播系統中軟件模擬I2S總線實現語音數據傳輸,給出了軟件模擬實現I2S總線的方法。 1 I2S總線規范 I2S為三線總線,3個信號分別為: ① 串行時鐘SCK,也叫位時鐘(BCK)。即每發送1位數字音頻數據,SCK上都有1個脈沖。SCK的頻率=2×采樣頻率×采樣位數。在數據傳輸過程中,I2S總線的發送器和接收器都可以作為系統的主機來提供系統的時鐘頻率。 ② 幀時鐘WS,即命令(聲道)選擇,用于切換左右聲道的數據。WS的頻率等于采樣頻率,由系統主機提供。WS為“1”表示傳輸的是左聲道的數據,WS為“0”表示傳輸的是右聲道的數據。 ③ 串行數據信號SD,用于傳輸二進制補碼表示的音頻數據。 I2S格式的信號無論有多少位有效數據,數據位的最高位(MSB)總是被最先傳輸,1次能夠發送的數據決定于I2S格式的有效位數。 1個典型的I2S信號時序如圖1所示
圖1 I2S總線典型時序圖 隨著技術的發展,在統一的I2S接口下出現了多種不同的數據格式。根據SD信號相對于SCK和WS位置的不同,分為左對齊和右對齊2種格式,如圖2和圖3所示。
圖2 16位有效位數的左對齊格式
圖3 16位有效位數的右對齊格式 在上面2種數據傳輸格式中,當WS為“1”時傳輸的是左聲道的數據,當WS為“0”時傳輸的是右聲道的數據。為了保證數字音頻信號的正確傳輸,發送端和接收端必須采用相同的數據格式。 2 軟件模擬I2S 以太網數字語音廣播系統主要是指以以太網為傳播介質提供音頻服務的廣播系統,將語音信號以標準IP包的形式在以太網上進行傳送,以實現語音廣播功能。該系統在PC機端通過麥克風采集語音數據,然后將采集到的語音數據通過以太網發送給嵌入式終端,嵌入式終端將接收到的語音數據進行數/模轉換后進行播放。系統實現框圖如圖4所示[5]。
圖4 以太網數字語音廣播系統框圖
圖5 LM3S8962與MS6336的連接圖 廣播系統終端的MCU LM3S8962將接收到的語音數據通過I2S總線發送給語音解碼芯片MS6336進行數/模轉換并播放, LM3S8962和MS6336的連接如圖5所示。為了完整還原出語音信號,需要保證軟件模擬I2S信號時序嚴格精確,高低電平的轉換采用延時程序實現。MS6336為16位D/A芯片,其I2S時序如圖6所示。
圖6 MS6336的典型I2S時序圖 該系統中的語音數據雙聲道,16位采樣,1個采樣點的數據為4字節,1個采樣點數據通過MCU發送給MS6336,數據發送流程如圖7所示。
圖7 1個采樣點數據發送流程 軟件模擬I2S引腳的定義如下: #define I2S_WS GPIO_PIN_5//模擬I2S聲道選擇時鐘控制位 #define I2S_BCK GPIO_PIN_6//模擬I2S位時鐘控制位 #define I2S_DATA GPIO_PIN_7//模擬I2S數據傳送位 根據MS6336的I2S總線格式以及數據發送流程,軟件模擬I2S總線的步驟如下: ① 根據語音數據采樣率及采樣位數計算得到SCK的值和WS的值(WS的值等于采樣頻率)。 系統采樣率為44.1 kHz,則SCK=2×44.1 kHz×103×16=1 411 200 Hz,WS=44 100 Hz。1個SCK時鐘周期T=1/SCK=07 μs。采用延時程序模擬SCK時鐘周期需要應用示波器來精確延時時間。本系統中一個SCK周期的延時為delayI2S(2)。 ② 將WS、BCK和DATA均置為高電平。 ③ 選擇左右聲道。首先發送左聲道數據,將WS置低(若發送右聲道數據則將WS置高)。 for(ChannelCnt=0;ChannelCnt<2;ChannelCnt++){//雙聲道選擇播放 if(ChannelCnt==0){//右聲道選擇信號為高電平 HWREG(GPIO_PORTA_BASE + (GPIO_O_DATA + (I2S_WS << 2))) = ~I2S_WS; } else{//左聲道選擇信號為低電平 HWREG(GPIO_PORTA_BASE + (GPIO_O_DATA + (I2S_WS << 2))) = I2S_WS; } …… } ④ 選擇高低字節。將左聲道數據以高低字節的順序發送,在發送高字節第1位數據之前先發送1個周期的串行時鐘。 for(HorLCnt=0;HorLCnt<2;HorLCnt++){//聲道數據高低字節選擇 if(ChannelCnt==1){//左聲道 if(HorLCnt==0){//低字節 c=*(SampleData+1);//SampleData指向音頻數據緩沖區首地址,即左聲道低字節 delayI2S(2);//發送第一個數據位之前需要延遲一個位時鐘周期 } else{//低字節 c=*SampleData; } } …… } ⑤ 開始傳輸音頻數據(音頻數據的傳輸在SCK下降沿準備數據,在SCK的上升沿發 送給數據接收端)。將采樣點左聲道數據的高字節最高位送給SD,設置SCK為低電平,此時為SCK的下降沿,數據準備好。延時半個SCK周期以后將 SCK置為高電平,此時SD線上的數據發送給數據接收端,延時半個SCK周期。依次將左聲道剩余位數據按照最高位的方式發送出去。 for(BitCnt=0;BitCnt<8;BitCnt++){//1次傳送的數據長度為8位,先傳送高字節再傳送低字節置時鐘線SCK為低,開始準備數據位 HWREG(GPIO_PORTA_BASE + (GPIO_O_DATA + (I2S_BCK << 2))) = ~I2S_BCK; if((c<<bitcnt)&0x80) { HWREG(GPIO_PORTA_BASE + (GPIO_O_DATA + (I2S_DATA << 2))) = I2S_DATA; } else{ HWREG(GPIO_PORTA_BASE + (GPIO_O_DATA + (I2S_DATA << 2))) = ~I2S_DATA; } delayI2S(1); //延時半個SCK時鐘周期置時鐘線為高,開始傳輸數據位 HWREG(GPIO_PORTA_BASE + (GPIO_O_DATA + (I2S_BCK << 2))) = I2S_BCK; delayI2S(1);//延時半個時鐘周期 } ⑥ 當將1個采樣點的左聲道的數據發送完以后,延時2個SCK周期,然后發送右聲道的數據(同左聲道數據的發送過程)。 根據以上的過程對每個采樣點的數據進行處理,就可以實現通過軟件模擬I2S總線傳輸音頻數據了。以上實現的是典型I2S時序模擬,而左對齊和右對齊2種格式只是時序稍有差異,模擬實現過程同典型I2S總線模擬實現過程基本相同。
結語 在以太網數字語音廣播系統中應用軟件模擬實現I2S總線時序,能夠成功地實現語音信號的數據傳輸,實現語音信號的實時廣播,表明了軟件模擬實現 I2S總線的可行性,為解決不支持I2S總線的MCU和各種I2S總線設備間的通信提供了一種可行的方法。但是,在應用軟件模擬實現I2S的以太網數字語 音廣播系統實時播放語音信號時,存在一些噪聲,表明在采用軟件模擬實現I2S的時序精確性上存在一些欠缺。 ? ? |