當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

智能音箱之音频通路质量--测试与参数

發布時間：2023/12/10 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了智能音箱之音频通路质量--测试与参数小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、概述

當將語音識別算法接入到設備時，務必要保證設備的音頻通路具有足夠的質量。因此對設備進行音頻測試，以評估能夠影響語音識別性能的音頻前端的音頻參數。如下要點對語音識別至關重要：

自然聲音
合適的增益
良好的信噪比
一致的響應，信號不能包括如下信息：自動增益控制 AGC? 啟動響應? 直流偏置過大
適當的頻響（高低滾降，理想平滑，沒有混跌）

二、測試設備

帶有錄音軟件的被測試設備
音頻測試儀器：CD機，均衡器，音箱，人工嘴和聲壓計
帶分析工具的PC機（CoolEditor、Audition、Audacity和Wavesurfer等）

三、音頻文件

正常音頻文件：用于主觀判斷音頻質量和增益設置以及信噪比；
大增益文件：用于判定削波時的增益設置；
1K-sine增益Sweep文件0~105dB：用于評估削波，決定最大數值和判定AGC存在與否；
0~8K/16K掃頻文件：用于測試設備的頻響和混跌；

四、測試項目

1. 主觀聽音

用質量好的耳機去聽設備的音質，從而發現一些非正常聲音；比如：雜音、諧波和共振等；

音頻路徑上過多的信號處理可能導致聲音畸變為人造聲，不符合正常自然聲音，會對軟件識別造成很大困難。

2. 增益評估

設備在各種使用場景下，務必保持增益的設置不要使信號削波；削波會嚴重降低識別性能，必須禁止。

95dB的聲音應該剛好填滿16bit音程；

3. 信噪比

靜默值作為底噪，聲音波形的中部作為信號；尤其注意某些記錄將具有數據實際值為零的引導/拖尾部分，不要使用這部分作為靜默測量；麥克風單體的信噪比，除了本身規格書之外，在實際產品中收到電路噪聲影響很大，尤其注意模擬麥克風bias電源。

信號比：S/N＞30對于識別是良好的比值，大于20也是可行的；如果小于20的話，則說明音頻路徑上太吵了導致很難識別成功。

4. 自動增益控制AGC

AGC的存在，當音頻信號的幅度增大時，它通常表現為增益逐步減小。它會影響識別效果，所以得關閉此功能，類似的有自動電平控制寄存器ALC等。

同時部分功放帶有動態調節音量的功能，務必關閉此項功能，否則嚴重影響AEC效果；所有的動態調節都務必在AEC采樣點之前進行，具體如下圖示意：

5. 啟動瞬態Startup transients

音頻系統經常在錄音命令下達后，需要一段時間才能真正啟動操作，這導致了啟動瞬態；如果這主要包括低頻的話，將不會對識別造成影響，因為識別器中有低通濾波器。

然而試圖消除瞬態的話，將信號鉗位在零電平上超過幾十毫秒的話，會嚴重影響識別。在這種情況下，最好完全跳過音頻，而不是將此錯誤信息發送給識別器。

? ? ? ? ? ? ? ??

上圖中紅色框中125ms的啟動瞬態，應該跳過。

6. 直流偏置過大DC offset

直流偏置可以看作是靜音信號在零信號線上高于或者低于的信號；

如果偏移量為滿刻度限制的百分之幾或者更少，是沒有問題的；

但是如果超過10%則需要糾正，很大的偏移將導致不對稱削波。

7. 頻響曲線Response curve

為了隔絕麥克分錄音到其他雜音，麥克風需要與喇叭足夠近，大致2.5cm處錄音。

檢查FFT大小設置為2048個采樣點，采樣窗口設置為Blackmann Harris；

理想的頻率響應曲線在頂端220Hz和3200~3900Hz之間的幾分貝內是平坦的，差值一般控制在10dB以內是可以接受的（16K采樣率的為6400Hz～7400Hz）如下圖所示：

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??

頻響曲線是個慢慢的漸變過程，如果個別區域出現急劇變化，應該重點關注并研究，音頻可能存在其他問題。

8. 混疊Aliasing

當超過采樣速率的一半（奈奎斯特極限）的信號被允許進入模數轉換器（ADC）時，出現混疊現象。如下為ES7210調試初期出現的混疊現象：

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??

混疊是影響識別的一個重大因素，必須消除混疊；

故ADC需要有抗混疊處理，例如抗混疊濾波器等。

9. 諧波失真Harmonic distortion

當錄音系統增加輸入信號的泛音時，會出現諧波失真；

AEC對信號失真是非常敏感的，音頻通路的整體諧波失真需要控制在5%以內，故從麥克風到功放到揚聲器和音腔，均需要嚴格控制；除了單體品質之外，尤其注意功放和揚聲器的功率匹配、阻抗匹配和頻率匹配；

如下圖為1K-sine信號的頻譜圖，有奇次諧波、偶次諧波：

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

如下圖為8K-sweep信號的頻譜圖，有奇次諧波、偶次諧波：

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??

諧波失真越小越好，一般要求最好是小于3%。

補充小結項：

1-靈敏度和諧波失真

2-頻響和混疊

3-失真和完整性

4-麥陣相關性

5-相對延遲、系統延遲

6-底噪

匯總補充如下：

麥克風信噪比：60~70 分近中遠三場景；

麥克風靈敏度：-40（模擬）? -26（數字）；

頻響平坦度：2dB?（100Hz~6KHz）；

收音孔氣密性：大于20dB；

麥克風一致性：相位小于10，幅度小于2dB；

麥克風間距：25~60mm之間；間距小影響低頻，間距大影響高頻；疊加裝配的誤差率，體驗上在常規噪音環境下影響喚醒率和打斷率1個點左右；

采樣信號幅度：最大幅度下不截幅；

采樣信號非線性失真：低頻小于10%，300Hz~2KHz小于3%；

采樣信號底噪：小于-70dB；

各通道信號同步；采樣波形無畸變，無混疊；

參考信號信噪比：大于40dB；

參考信號：無截幅；

總結

以上是生活随笔為你收集整理的智能音箱之音频通路质量--测试与参数的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： ORACLE快速遍历树及join基表很大
下一篇：智能音箱之平台方案简介

编程问答

智能音箱 之 音频通路质量--测试与参数

總結

智能音箱之音频通路质量--测试与参数