日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 综合教程 >内容正文

综合教程

声源定位方法_声源定位算法

發(fā)布時(shí)間:2023/12/24 综合教程 48 生活家
生活随笔 收集整理的這篇文章主要介紹了 声源定位方法_声源定位算法 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

目錄

1. TDOA簡(jiǎn)介

2. 時(shí)延估計(jì)

3. 定位估計(jì)

4. 聲源定位


根據(jù)現(xiàn)有的研究成果來(lái)看,聲源定位(Sound Source Localization, SSL)存在以下幾種方法:基于最大輸出功率的可控波束成形的定位方法、基于高分辨譜估計(jì)的定位方法和基于到達(dá)時(shí)延差(Time Difference of Arrival,TDOA)估計(jì)的定位方法,以及基于機(jī)器學(xué)習(xí)的方法。其中基于時(shí)延估計(jì)的定位方法計(jì)算量小,實(shí)時(shí)性好,實(shí)用性強(qiáng)等特點(diǎn),我們就先介紹這種較為簡(jiǎn)單的聲源定位算法。基于TDOA的方法一般分為兩步,首先計(jì)算聲源信號(hào)到達(dá)麥克風(fēng)陣列的時(shí)間差(時(shí)延估計(jì)),然后通過(guò)麥克風(fēng)陣列的幾何形狀建立聲源定位模型并求解從而獲得位置信息(定位估計(jì))。

1. TDOA簡(jiǎn)介

首先介紹下TDOA的概念,如圖所示,假設(shè)我們?cè)诳臻g中有一個(gè)聲源(記為s(t),其在空間的位置為S)兩個(gè)麥克風(fēng)(記為m1和m2,它們?cè)诳臻g的位置分別為M1M2,接收到的信號(hào)為x1(t)和x2(t)

那么麥克風(fēng)m1和m2收到的信號(hào)分別為:

其中τ1和τ2分別是聲源到達(dá)兩個(gè)麥克風(fēng)的延遲時(shí)間,n1(t)和n2(t)為加性噪聲。那么聲源信號(hào)到達(dá)兩個(gè)麥克風(fēng)的TDOA為

τ1和τ2可以通過(guò)下式計(jì)算

其中c是聲速。一般情況下,我們選擇一個(gè)麥克風(fēng)的信號(hào)作為參考信號(hào),例如我們把M2作為參考信號(hào),那么τ2=0。在麥克風(fēng)陣列幾何形狀已知的情況下,聲源定位問(wèn)題變?yōu)閷?duì)時(shí)延的估計(jì)問(wèn)題。

2. 時(shí)延估計(jì)

時(shí)延估計(jì)常用的有很多種比如使用廣義互相關(guān)函數(shù)(Generalized Cross Correlation, GCC)估計(jì)時(shí)延,或者使用倒譜分析進(jìn)行時(shí)延估計(jì)等,這里介紹常用的基于廣義互相關(guān)函數(shù)時(shí)延估計(jì)方法。

互相關(guān)函數(shù)我們以前已經(jīng)介紹過(guò)了,而廣義互相關(guān)函數(shù)是為了減少噪聲和混響在實(shí)際環(huán)境中的影響,在互功率譜域使用加權(quán)函數(shù)加權(quán),然后經(jīng)過(guò)IFFT運(yùn)算后找到峰值估計(jì)時(shí)延,其流程如下圖所示:

廣義GCC計(jì)算公式為:

其中Ψ12為頻域加權(quán)函數(shù),常用的有如下幾種

Gx1x2(ω)為互頻譜,其計(jì)算公式為:

最后我們就可以通過(guò)式(8)估計(jì)語(yǔ)音信號(hào)到達(dá)兩個(gè)麥克風(fēng)的時(shí)延了。

3. 定位估計(jì)

如果要確定出聲源在二維平面內(nèi)的位置坐標(biāo),都至少需要三個(gè)麥克風(fēng)。對(duì)于兩個(gè)麥克風(fēng)的情況,我們只能計(jì)算到達(dá)角(Direction of Arrival, DOA)。在介紹如何定位估計(jì)前需要先區(qū)分下近場(chǎng)(near-field)和遠(yuǎn)場(chǎng)(far-field),假設(shè)聲速波長(zhǎng)為λ,麥克風(fēng)之間的距離為d(有的地方稱為孔徑,aperture),那么聲源與麥克風(fēng)之間的距離r大于2d2/λ時(shí),符合遠(yuǎn)場(chǎng)模型,反之則為近場(chǎng)模型。對(duì)于遠(yuǎn)場(chǎng)模型來(lái)說(shuō),聲源到達(dá)麥克風(fēng)陣列的波形視為平面波,如下圖所示:

此時(shí)根據(jù)麥克風(fēng)陣列的幾何關(guān)系,我們有

進(jìn)而可以求出,聲源相對(duì)麥克風(fēng)陣列的角度

對(duì)于近場(chǎng)模型來(lái)說(shuō),聲源到達(dá)麥克風(fēng)陣列的波形視為球面波,如下圖所示:

近場(chǎng)模型需要三個(gè)麥克風(fēng),我們假設(shè)τ12,τ13分別為第二和第三個(gè)麥克風(fēng)與第一個(gè)麥克風(fēng)的時(shí)延,那么

根據(jù)麥克風(fēng)陣列的幾何關(guān)系,我們得到

其中τ12,τ13通過(guò)時(shí)延估計(jì)得到,因此可以求解公式(11)到(13)的方程組,進(jìn)而使用正弦定理可以得到θ2和θ3。

4. 聲源定位

在麥克風(fēng)孔徑不大的情況下,一般都符合遠(yuǎn)場(chǎng)模型(不信讀者可自己算一下),因此這里應(yīng)用遠(yuǎn)場(chǎng)模型進(jìn)行聲源定位。聲源位置在大約在45度角,麥克風(fēng)之間的距離為0.15m,48 kHz的采樣率,使用gcc-phat進(jìn)行時(shí)延估計(jì),結(jié)果如下圖所示(代碼和數(shù)據(jù)還是在公眾號(hào)菜單More->Code里面)。

可以看到大體上方向還是被正確估計(jì)到,想必聰明的讀者已經(jīng)發(fā)現(xiàn)了聲源定位的一些數(shù)據(jù)可以進(jìn)行VAD結(jié)果的判定。這里的Demo比較簡(jiǎn)單,采用的是單源自由場(chǎng)模型,真實(shí)情況下需要考慮更多的問(wèn)題,比如房間的混響,噪聲,聲源個(gè)數(shù)等問(wèn)題。另外gcc-phat只能用于雙麥克風(fēng)陣列,如果你有多個(gè)麥克風(fēng),可以使用Spatial Linear Prediction Method 方法去利用麥克風(fēng)之間的冗余信息獲得更為精確的定位結(jié)果。此外波束成形(Beam forming, BF)和聲源定位聯(lián)系比較密切,因?yàn)闀r(shí)延和BF所要求的導(dǎo)向量等價(jià),因此也有基于BF的聲源定位算法。最后提一下機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的定位方法,前面的流程還是不變,只是最后通過(guò)最大值估計(jì)時(shí)延的這一步換成了使用機(jī)器學(xué)習(xí)模型來(lái)估計(jì)時(shí)延,即模型輸入為gcc-phat,輸出結(jié)果為時(shí)延。然后根據(jù)這個(gè)時(shí)延進(jìn)行聲源定位。


參考文獻(xiàn):

[1].https://www.canalu.tv/video/inria/time_difference_of_arrival_tdoa.33273

[2]. Springer, Micrphone Array Processing,2008


總結(jié)

以上是生活随笔為你收集整理的声源定位方法_声源定位算法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。