日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

麦克风声源定位原理_基于麦克风阵列的声源定位算法之GCC-PHAT

發(fā)布時(shí)間:2023/12/15 编程问答 65 豆豆
生活随笔 收集整理的這篇文章主要介紹了 麦克风声源定位原理_基于麦克风阵列的声源定位算法之GCC-PHAT 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

目前基于麥克風(fēng)陣列的聲源定位方法大致可以分為三類:基于最大輸出功率的可控波束形成技術(shù)、基于高分辨率譜圖估計(jì)技術(shù)和基于聲音時(shí)間差(time-delay estimation,TDE)的聲源定位技術(shù)。

基于TDE的算法核心在于對傳播時(shí)延的準(zhǔn)確估計(jì),一般通過對麥克風(fēng)間信號(hào)做互相關(guān)處理得到。進(jìn)一步獲得聲源位置信息,可以通過簡單的延時(shí)求和、幾何計(jì)算或是直接利用互相關(guān)結(jié)果進(jìn)行可控功率響應(yīng)搜索等方法。這類算法實(shí)現(xiàn)相對簡單,運(yùn)算量小,便于實(shí)時(shí)處理,因此在實(shí)際中運(yùn)用最廣。

GCC-PHAT

基于廣義互相關(guān)函數(shù)的時(shí)延估計(jì)算法引入了一個(gè)加權(quán)函數(shù),對互功率譜密度進(jìn)行調(diào)整,從而優(yōu)化時(shí)延估計(jì)的性能。根據(jù)加權(quán)函數(shù)的不同,廣義互相關(guān)函數(shù)有多種不同的變形,其中廣義互相關(guān)-相位變換方法(Generalized Cross Correlation PHAse Transformation,GCC-PHAT)方法應(yīng)用最為廣泛。GCC-PHAT方法本身具有一定的抗噪聲和抗混響能力,但是在信噪比降低和混響增強(qiáng)時(shí),該算法性能急劇下降。

研究表明麥克風(fēng)對的GCC-PHAT函數(shù)的最大值越大則該對麥克風(fēng)的接收信號(hào)越可靠,也就是接收信號(hào)質(zhì)量越高。

1、計(jì)算傳播時(shí)延

廣義互相關(guān)函數(shù)時(shí)延估計(jì)算法根據(jù)兩個(gè)麥克風(fēng)信號(hào)的互相關(guān)函數(shù)峰值來估計(jì)時(shí)延值。在聲源定位系統(tǒng)中,麥克風(fēng)陣列的每個(gè)陣元接收到的目標(biāo)信號(hào)都來自于同一個(gè)聲源。因此,各通道信號(hào)之間具有較強(qiáng)的相關(guān)性。理想情況下,通過計(jì)算每兩路信號(hào)之間的相關(guān)函數(shù),就可以確定兩個(gè)麥克風(fēng)觀測信號(hào)之間的時(shí)延。

陣列中兩個(gè)麥克風(fēng)的接收信號(hào)為:

其中s(t)為聲源信號(hào),n1(t)和n2(t)為環(huán)境噪聲,τ1和τ2是信號(hào)從聲源處傳播到兩個(gè)麥克風(fēng)陣元的傳播時(shí)間。相關(guān)參數(shù)可參見下圖:

互相關(guān)算法經(jīng)常被用來做時(shí)延估計(jì),表示為:

代入信號(hào)模型,則有:

此時(shí)因?yàn)閟(t)和n1(t)互不相關(guān),上式可以簡化為:

其中τ12=τ1-τ2,假設(shè)n1和n2是互不相關(guān)的高斯白噪聲,則上式可以進(jìn)一步簡化為:

由相關(guān)函數(shù)的性質(zhì)可知,當(dāng)τ12=τ1-τ2時(shí),Rx1x2(τ)取最大值,是兩個(gè)麥克風(fēng)之間的時(shí)延。

互相關(guān)函數(shù)和互功率譜的關(guān)系:

在麥克風(fēng)陣列信號(hào)處理實(shí)際模型中,由于存在混響和噪聲影響,導(dǎo)致Rx1x2(τ)的峰值不明顯,降低了時(shí)延估計(jì)的精度。為了銳化Rx1x2(τ)的峰值,可以根據(jù)信號(hào)和噪聲的先驗(yàn)知識(shí),在頻域內(nèi)對互功率譜進(jìn)行加權(quán),從而能抑制噪聲和混響干擾。最后進(jìn)行傅里葉逆變換,得到廣義互相關(guān)函數(shù)Rx1x2(τ):

其中φ12(w)表示頻域加權(quán)函數(shù)。廣義互相關(guān)時(shí)延估計(jì)算法框圖如下:

2、常用加權(quán)函數(shù)及其特點(diǎn)

相位變換加權(quán)函數(shù)的表達(dá)式為:

由上式可知,相位變換加權(quán)函數(shù)實(shí)質(zhì)上是一個(gè)白化濾波器,使得信號(hào)間的互功率譜更加平滑,從而銳化廣義互相關(guān)函數(shù)。經(jīng)過PHAT加權(quán)之后,Rx1x2(τ)廣義互相關(guān)函數(shù)的表達(dá)式為:

可以看出,經(jīng)過PHAT加權(quán)的互功率譜近似于單位沖激響應(yīng)的表達(dá)式,突出了時(shí)延的峰值,能夠有效抑制混響噪聲,提高時(shí)延估計(jì)的精度和準(zhǔn)確度。

3、互相關(guān)函數(shù)

x(n)和y(n)的互相關(guān)函數(shù)是將x(n)保持不動(dòng), y(n)左移m個(gè)樣本點(diǎn),兩個(gè)序列逐個(gè)相乘的結(jié)果,順序不能互換。但是,按照時(shí)域卷積的方式求互相關(guān)函數(shù)的方法計(jì)算復(fù)雜度較大,所以將在頻域進(jìn)行操作(FFT和IFFT),即線性卷積的FFT算法。

兩個(gè)信號(hào)的互相關(guān)函數(shù)的頻域等于x信號(hào)頻域的共軛乘以Y信號(hào)的頻域。

4、近場和遠(yuǎn)場

需要說明的是,GCC-PHAT算法是用在近場模型下的。

當(dāng)聲源足夠遠(yuǎn)時(shí),麥克風(fēng)陣列的直徑與聲源距離相比可忽略,此時(shí)一般采用遠(yuǎn)場模型。遠(yuǎn)場模型認(rèn)為聲源位于無窮遠(yuǎn)處,麥克風(fēng)接收到的聲波為平面波,此時(shí)我們僅考慮聲波的入射方向,而不考慮聲源相對于麥克風(fēng)陣列的的距離。

當(dāng)聲源的距離較近時(shí),我們需要考慮聲源相對于麥克風(fēng)陣列中的距離,此時(shí)遠(yuǎn)場模型里不再適用,應(yīng)當(dāng)采用近場模型。近場模型認(rèn)為麥克風(fēng)接收到的聲波為球面波。近場模型更符合實(shí)際應(yīng)用情況,能提供更多的聲源位置信息,提高定位的精度。

通常,判斷近場和遠(yuǎn)場的經(jīng)驗(yàn)公式為:

其中d為麥克風(fēng)陣列的直徑,λ為目標(biāo)信號(hào)的波長,r為麥克風(fēng)陣列和聲源之間距離。

在實(shí)際的近場模型應(yīng)用中,麥克風(fēng)陣列所接收到的信號(hào)主要包括3部分;聲源直達(dá)信號(hào)、經(jīng)過墻壁或障礙物的反射信號(hào)以及環(huán)境噪聲信號(hào)。

SRP-PHAT

SRP-PHAT(Steered Response Power - Phase Transform) 基于相位變換加權(quán)的可控響應(yīng)功率的聲源定位算法。

基于麥克風(fēng)陣列的聲源定位方法很多,相位變換加權(quán)的可控響應(yīng)功率SRP-PHAT聲源定位算法在混響環(huán)境中有較強(qiáng)的魯棒性,可實(shí)現(xiàn)真實(shí)環(huán)境中的聲源定位,因此該算法得到了廣泛應(yīng)用。SRP-PHAT對陣型沒有特定要求,因此也適用于分布式陣列,事實(shí)上很多基于分布式陣列的定位系統(tǒng)采用了該算法。

SRP-PHAT算法的基本原理是在假想聲源位置計(jì)算所有麥克風(fēng)對接收信號(hào)的相位變換加權(quán)的廣義互相關(guān)GCC-PHAT函數(shù)之和,在整個(gè)聲源空間尋找使SRP值最大的點(diǎn)即為聲源位置估計(jì)。SRP-PHAT對混響有較強(qiáng)的魯棒性,但是在低信噪比SNR(Signal-to-NoiseRatio)環(huán)境中其定位性能較差。

SRP-PHAT算法的計(jì)算流程如下:

其中, Q 為預(yù)先設(shè)定的搜索空間。

SRP-PHAT法是一種對窄帶和寬帶信號(hào)均可適用的有效方法, 得到了廣泛研究和應(yīng)用。但是由于其全局搜索算法運(yùn)算量較大,限制了該方法的實(shí)時(shí)性。

擴(kuò)展

GCC時(shí)延估計(jì)中,信號(hào)x1和x2都采用理想模型,并沒有過多考慮混響噪聲,所以當(dāng)混響較強(qiáng)時(shí),GCC時(shí)延估計(jì)算法效果較差。而自適應(yīng)最小均方算法采用麥克風(fēng)信號(hào)的實(shí)際模型,通過自適應(yīng)濾波產(chǎn)生h1(n)和h2(n),再從h1(n)和h2(n)中估計(jì)時(shí)延,可以有效抑制混響的影響。

實(shí)際模型中,第i個(gè)麥克風(fēng)接收的信號(hào)xi(t)可以表示為:

其中aik表示第k條反射路徑到達(dá)第i個(gè)麥克風(fēng)的能量衰減,τik表示對應(yīng)的時(shí)延。*表示信號(hào)卷積,hi(t)稱之為房間單位沖激響應(yīng)函數(shù),從數(shù)學(xué)角度反映了房間互相的物理特性。麥克風(fēng)陣列信號(hào)的實(shí)際模型見下圖:

如圖所示,實(shí)際模型中,麥克風(fēng)接收信號(hào)不僅包括聲源的直達(dá)信號(hào)和環(huán)境噪聲,還包括語音信號(hào)在墻壁以及房間的其他物體之間重復(fù)反射再到達(dá)麥克風(fēng)的信號(hào),我們稱之為混響。

更多地,麥克風(fēng)陣列信號(hào)的理想模型參見下圖:

如上圖所示,在理想模型中,假設(shè)麥克風(fēng)陣列的所有陣元接收到的語音信號(hào)只包含直達(dá)信號(hào)與噪聲信號(hào),噪聲信號(hào)為環(huán)境噪聲(高斯白噪聲),并且每個(gè)麥克風(fēng)之間的噪聲相互獨(dú)立。

總結(jié)

以上是生活随笔為你收集整理的麦克风声源定位原理_基于麦克风阵列的声源定位算法之GCC-PHAT的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。