智能音箱 之 音频通路质量--测试与参数
一、概述
當將語音識別算法接入到設備時,務必要保證設備的音頻通路具有足夠的質量。因此對設備進行音頻測試,以評估能夠影響語音識別性能的音頻前端的音頻參數。如下要點對語音識別至關重要:
- 自然聲音
- 合適的增益
- 良好的信噪比
- 一致的響應,信號不能包括如下信息: 自動增益控制 AGC? 啟動響應? 直流偏置過大
- 適當的頻響 (高低滾降,理想平滑,沒有混跌)
二、測試設備
- 帶有錄音軟件的被測試設備
- 音頻測試儀器:CD機,均衡器,音箱,人工嘴和聲壓計
- 帶分析工具的PC機(CoolEditor、Audition、Audacity和Wavesurfer等)
三、音頻文件
- 正常音頻文件:用于主觀判斷音頻質量和增益設置以及信噪比;
- 大增益文件:用于判定削波時的增益設置;
- 1K-sine增益Sweep文件0~105dB:用于評估削波,決定最大數值和判定AGC存在與否;
- 0~8K/16K掃頻文件:用于測試設備的頻響和混跌;
四、測試項目
1. 主觀聽音
用質量好的耳機去聽設備的音質,從而發現一些非正常聲音;比如:雜音、諧波和共振等;
音頻路徑上過多的信號處理可能導致聲音畸變為人造聲,不符合正常自然聲音,會對軟件識別造成很大困難。
2. 增益評估
設備在各種使用場景下,務必保持增益的設置不要使信號削波;削波會嚴重降低識別性能,必須禁止。
95dB的聲音應該剛好填滿16bit音程;
3. 信噪比
靜默值作為底噪,聲音波形的中部作為信號;尤其注意某些記錄將具有數據實際值為零的引導/拖尾部分,不要使用這部分作為靜默測量;麥克風單體的信噪比,除了本身規格書之外,在實際產品中收到電路噪聲影響很大,尤其注意模擬麥克風bias電源。
信號比:S/N>30對于識別是良好的比值,大于20也是可行的;如果小于20的話,則說明音頻路徑上太吵了導致很難識別成功。
?
4. 自動增益控制AGC
AGC的存在,當音頻信號的幅度增大時,它通常表現為增益逐步減小。它會影響識別效果,所以得關閉此功能,類似的有自動電平控制寄存器ALC等。
同時部分功放帶有動態調節音量的功能,務必關閉此項功能,否則嚴重影響AEC效果;所有的動態調節都務必在AEC采樣點之前進行,具體如下圖示意:
?
?
?
5. 啟動瞬態Startup transients
音頻系統經常在錄音命令下達后,需要一段時間才能真正啟動操作,這導致了啟動瞬態;如果這主要包括低頻的話,將不會對識別造成影響,因為識別器中有低通濾波器。
然而試圖消除瞬態的話,將信號鉗位在零電平上超過幾十毫秒的話,會嚴重影響識別。在這種情況下,最好完全跳過音頻,而不是將此錯誤信息發送給識別器。
? ? ? ? ? ? ? ??
上圖中紅色框中125ms的啟動瞬態,應該跳過。
6. 直流偏置過大DC offset
直流偏置可以看作是靜音信號在零信號線上高于或者低于的信號;
如果偏移量為滿刻度限制的百分之幾或者更少,是沒有問題的;
但是如果超過10%則需要糾正,很大的偏移將導致不對稱削波。
7. 頻響曲線Response curve
為了隔絕麥克分錄音到其他雜音,麥克風需要與喇叭足夠近,大致2.5cm處錄音。
檢查FFT大小設置為2048個采樣點,采樣窗口設置為Blackmann Harris;
理想的頻率響應曲線在頂端220Hz和3200~3900Hz之間的幾分貝內是平坦的,差值一般控制在10dB以內是可以接受的(16K采樣率的為6400Hz~7400Hz)如下圖所示:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
頻響曲線是個慢慢的漸變過程,如果個別區域出現急劇變化,應該重點關注并研究,音頻可能存在其他問題。
8. 混疊Aliasing
當超過采樣速率的一半(奈奎斯特極限)的信號被允許進入模數轉換器(ADC)時,出現混疊現象。如下為ES7210調試初期出現的混疊現象:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
混疊是影響識別的一個重大因素,必須消除混疊;
故ADC需要有抗混疊處理,例如抗混疊濾波器等。
9. 諧波失真Harmonic distortion
當錄音系統增加輸入信號的泛音時,會出現諧波失真;
AEC對信號失真是非常敏感的,音頻通路的整體諧波失真需要控制在5%以內,故從麥克風到功放到揚聲器和音腔,均需要嚴格控制;除了單體品質之外,尤其注意功放和揚聲器的功率匹配、阻抗匹配和頻率匹配;
如下圖為1K-sine信號的頻譜圖,有奇次諧波、偶次諧波:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
?
如下圖為8K-sweep信號的頻譜圖,有奇次諧波、偶次諧波:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
諧波失真越小越好,一般要求最好是小于3%。
?
補充小結項:
| 1-靈敏度和諧波失真 |
| 2-頻響和混疊 |
| 3-失真和完整性 |
| 4-麥陣相關性 |
| 5-相對延遲、系統延遲 |
| 6-底噪 |
匯總補充如下:
麥克風信噪比:60~70 分近中遠三場景;
麥克風靈敏度:-40(模擬)? -26(數字);
頻響平坦度:2dB?(100Hz~6KHz);
收音孔氣密性:大于20dB;
麥克風一致性:相位小于10,幅度小于2dB;
麥克風間距:25~60mm之間; 間距小影響低頻,間距大影響高頻;疊加裝配的誤差率,體驗上在常規噪音環境下影響喚醒率和打斷率1個點左右;
?
采樣信號幅度:最大幅度下不截幅;
采樣信號非線性失真:低頻小于10%,300Hz~2KHz小于3%;
采樣信號底噪:小于-70dB;
各通道信號同步;采樣波形無畸變,無混疊;
參考信號信噪比:大于40dB;
參考信號:無截幅;
?
?
?
?
?
總結
以上是生活随笔為你收集整理的智能音箱 之 音频通路质量--测试与参数的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ORACLE快速遍历树及join基表很大
- 下一篇: 智能音箱 之 平台方案简介