回声消除的昨天、今天和明天
導(dǎo)讀:回聲消除是音頻通話中最為復(fù)雜的模塊,對(duì)于音頻通話質(zhì)量起到至關(guān)重要的作用。一直以來(lái),網(wǎng)易云信致力于提供良好的回聲消除性能,為用戶提供優(yōu)異的音頻通話質(zhì)量。本篇文章中網(wǎng)易智企音視頻開發(fā)專家將和大家共同回顧回聲消除的歷史,分析回聲消除的現(xiàn)狀,并展望回聲消除進(jìn)一步發(fā)展的方向。
?
一、歷史:
回聲是一種物理和生理共同作用產(chǎn)生的聲學(xué)現(xiàn)象。原始聲被反射后反射聲和原始聲的延時(shí)超過(guò)100ms時(shí),人耳可以聽到分離的兩個(gè)聲音,一般在空曠的山谷這一類地方容易聽到回聲。
通話中聽到的回聲一般有兩種,線路回聲和聲學(xué)回聲。線路回聲是因?yàn)樵陂L(zhǎng)途電話線網(wǎng)絡(luò)中,存在二四線轉(zhuǎn)換的問(wèn)題。本地電話—般是用二線電路連接到中心局的,而長(zhǎng)途線路的話,需要用四線電路,這兩者之間需要用混合變換器進(jìn)行連接。混合變換器的引入使得傳輸?shù)男盘?hào)在混合變換器阻抗不匹配的情況下產(chǎn)生電路回聲。
而我們現(xiàn)在在數(shù)字通話中提到的回聲一般是指聲學(xué)回聲,聲學(xué)回聲的原因是揚(yáng)聲器發(fā)出的聲音被麥克風(fēng)獲取后傳回遠(yuǎn)端,這樣一來(lái)遠(yuǎn)端說(shuō)話者就可以聽見自己發(fā)出的聲音。
聲學(xué)回聲問(wèn)題在早期電話應(yīng)用中并不凸顯,主要是因?yàn)槭褂玫脱訒r(shí)的模擬技術(shù)并且通訊距離普遍較短。20 世紀(jì)中葉以后,由于衛(wèi)星系統(tǒng)發(fā)展的需要提出了回聲消除問(wèn)題,曾經(jīng)采取的解決一種方法是使用切換的方式來(lái)隔斷回音信號(hào),這種方法雖然能夠有效地隔斷回聲,但是卻無(wú)法平常一樣自然地交談。
隨著通話回聲日益受到重視,人們采取了各種各樣的措施來(lái)對(duì)回聲進(jìn)行抑制或消除。 上個(gè)世紀(jì)六十年代以前,由于客觀條件和技術(shù)的限制,人們采用一種叫回聲抑制器的方法來(lái)實(shí)現(xiàn)回聲消除。回聲抑制就是對(duì)回聲進(jìn)行一定程度衰減以提高通信質(zhì)量,但是回聲抑制器只對(duì)很小的時(shí)間延遲才有良好的效果。隨著衛(wèi)星通信和IP 電話的發(fā)展,出現(xiàn)了傳輸時(shí)延超過(guò)100--300ms的電路,對(duì)于這么大的時(shí)延,回聲抑制器的工作效果很差,于是人們開始研究新的回聲消除技術(shù),基于自適應(yīng)濾波器的回聲消除技術(shù)逐漸成為主流方向。從20世紀(jì)80年代以來(lái),隨著回聲消除技術(shù)從簡(jiǎn)單的回聲抑制器到自適應(yīng)回聲消除器的發(fā)展,國(guó)際電聯(lián)ITU先后制 定了消除線路回聲的G165(Echo Canceller),消除音頻終端回聲的G167(Acoustic Echo Canceller)及消除數(shù)字網(wǎng)絡(luò)回波的G 168(Digital Network Echo Canceller)等 回聲消除器相關(guān)標(biāo)準(zhǔn)。
現(xiàn)狀:
理論上來(lái)說(shuō)基于自適應(yīng)濾波器架構(gòu)并不是回聲消除的唯一選擇,但是由于技術(shù)的限制和歷史沿襲使得目前的回聲消除基本都是以自適應(yīng)濾波器架構(gòu)為基礎(chǔ)。
從回聲消除的工作原理來(lái)看,它是一個(gè)典型的系統(tǒng)辨識(shí)應(yīng)用,辨識(shí)回聲路徑,利用參考信號(hào)和回聲路徑的卷積產(chǎn)生回聲的估計(jì),然后從混合輸入中去除回聲估計(jì)。使用自適應(yīng)濾波器進(jìn)行系統(tǒng)辨識(shí)是一個(gè)很自然的選擇。經(jīng)過(guò)長(zhǎng)時(shí)間的技術(shù)發(fā)展,研究人員在自適應(yīng)濾波器的性能研究上取得大量成績(jī),對(duì)于回聲消除常用的自適應(yīng)算法特性了解的比較深入。
一些常用自適應(yīng)濾波器算法特性如下:
1.最小均方(LMS,least-mean-square)算法,是隨機(jī)梯度算法族 中的一員。該算法在隨機(jī)輸入維納濾波器遞推計(jì)算中使用確定性梯度,其基本原理是使誤差信號(hào)的均方誤差最小,它的核心思想是用平方誤差代替均方誤差。LMS算法簡(jiǎn)單,運(yùn)算量小,很容易在通用的數(shù)字信號(hào)處理器上實(shí)現(xiàn),但是LMS算法的收斂速度依賴于輸入信號(hào)矢量的自相關(guān)均值的特征值擴(kuò)散度,擴(kuò)散度很大時(shí),收斂速度將很慢。對(duì)于相關(guān)性較強(qiáng)的語(yǔ)音信號(hào),LMS算法的收斂速度會(huì)很慢。
2.為了克服經(jīng)典的LMS算法收斂慢和對(duì)噪聲較敏感的缺點(diǎn),人們將濾波器系數(shù)矢量用輸入信號(hào)的功率進(jìn)行歸一化,得到歸一化最小均方(NLMS)算法。歸—化技術(shù)減少了收斂速度對(duì)輸入信號(hào)功率的依賴性,其代價(jià)是計(jì)算量增加。但階數(shù)增大時(shí),增加的計(jì)算量相對(duì)較少。簡(jiǎn)言之,在計(jì)算復(fù)雜性方面,NLMS算法的計(jì)算效率與LMS算法相當(dāng)。同時(shí),當(dāng)輸入信號(hào)為語(yǔ)音時(shí),NLMS算法比LMS算法的收斂速度快,且穩(wěn)定性好。因此,NLMS算法比LMS算法更適合于回聲消除器的應(yīng)用。
3.PNLMS算法及其改進(jìn)算法是對(duì)NLMS算法步長(zhǎng)控制的修改。它的收斂速度較快,對(duì)稀疏回聲路徑很有效。IPNLMS算法是對(duì)PNLMS算法的改進(jìn),對(duì)回聲路徑 稀疏性的要求不高。
4.AP算法可以看成是NLMS算法的擴(kuò)展。由于使用了更多的輸入向量,收斂速率得到比NLMS算法更快的收斂速度。AP算法的失調(diào)與輸入矢量數(shù)(即AP算法的階數(shù))無(wú)關(guān)。隨著階數(shù)的增加,收斂速度加快,但是收斂速度加快的幅度在減小。增加階數(shù)來(lái)提高收斂速度是以增加算法的計(jì)算復(fù)雜度為代價(jià)的。AP算法的計(jì)算復(fù)雜度比NLMS高很多。AP算法的收斂速度和計(jì)算量介于 NLMS算法和RLS算法之間。
5.和隨機(jī)梯度算法不同,RLS算法屬于最小二乘算法。RLS算法的收斂速度比 LMS算法快—個(gè)數(shù)量級(jí)。隨著迭代次數(shù)趨于無(wú)限,RLS算法的額外均方誤差收斂于零。但是,因?yàn)橛昧司仃嚽竽嬗?jì)算,RLS算法的運(yùn)算量大,對(duì)于沖激響應(yīng)超過(guò)百毫秒的回聲信號(hào)的消除問(wèn)題來(lái)說(shuō),其運(yùn)算量大難以實(shí)現(xiàn)。
目前的回聲消除模塊大部分都是基于以上某一類算法或者其變種,在較為接近理想情況下,現(xiàn)有自適應(yīng)濾波算法均能得到較為滿意的回聲消除效果,然而這只是實(shí)際通話中多數(shù)時(shí)間下的一個(gè)理想狀態(tài),實(shí)際通話情況復(fù)雜的多。本端噪聲干擾,信號(hào)路徑中的非線性變換,雙方同時(shí)講話,非實(shí)時(shí)操作系統(tǒng)帶來(lái)的數(shù)據(jù)延時(shí)抖動(dòng)等,都是一個(gè)通用回聲消除模塊需要解決的問(wèn)題。
例如當(dāng)存在明顯的近端聲音時(shí),基于現(xiàn)有各種自適應(yīng)濾波算法的回聲消除器的性能將發(fā)生惡化,甚至不能保證自適應(yīng)濾波算法的收斂。這就是回聲消除在實(shí)際應(yīng)用中的必須解決的關(guān)鍵問(wèn)題,通常稱為雙端發(fā)聲(Double-talk)問(wèn)題。當(dāng)前針對(duì)這一情況,最常用的方法就是加入雙端通話檢測(cè)器(Double Talk Detector,DTD),當(dāng)雙方同時(shí)講話時(shí)讓自適應(yīng)濾波器鎖定或者慢變來(lái)防止自適應(yīng)過(guò)程發(fā)散。
如何在實(shí)時(shí)通話情況下對(duì)這些附加問(wèn)題上給出滿意的邏輯和精細(xì)調(diào)整對(duì)于產(chǎn)品化非常重要,也是目前導(dǎo)致產(chǎn)品性能差異的主要原因。當(dāng)前商用產(chǎn)品中的回聲消除模塊多數(shù)情況下都能取得滿意的效果,然而在某些特殊情況下都會(huì)有處理不善的地方,對(duì)更高通話品質(zhì)的要求依然是研究更好的回聲消除模塊的動(dòng)力。
未來(lái):
由于通話回聲問(wèn)題的復(fù)雜性,對(duì)回聲消除模塊效果提升的需求始終存在。當(dāng)前方案的固有問(wèn)題使得前述一些關(guān)鍵問(wèn)題很難取得突破性進(jìn)展。由于近年來(lái)設(shè)備算力的提高以及技術(shù)的發(fā)展,一些新的方案也被提出。以Volterra濾波器為基礎(chǔ)的非線性濾波器解決方案,基于ICA和深度學(xué)習(xí)的回聲消除算法研究等也開始出現(xiàn),基于線性自適應(yīng)濾波器架構(gòu)的回聲消除算法面臨挑戰(zhàn)。然而還沒(méi)有另外一個(gè)架構(gòu)能像當(dāng)前的自適應(yīng)濾波器架構(gòu)一樣被廣為使用,短期內(nèi)回聲消除算法依然還會(huì)作為一個(gè)常見技術(shù)話題存在。
網(wǎng)易云信在回聲消除邏輯改善和新方案研究上持續(xù)推進(jìn)研究,致力于為用戶提供更好的音頻通話效果。
?
了解網(wǎng)易云信,來(lái)自網(wǎng)易核心架構(gòu)的通信與視頻云服務(wù)>>
更多技術(shù)干貨,歡迎關(guān)注vx公眾號(hào)“網(wǎng)易智慧企業(yè)技術(shù)+”。系列課程提前看,精品禮物免費(fèi)得,還可直接對(duì)話CTO。
?
與50位技術(shù)專家面對(duì)面20年技術(shù)見證,附贈(zèng)技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的回声消除的昨天、今天和明天的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: SaaS数据驱动浅谈
- 下一篇: 网易云信携手SNH48 GROUP,打造