當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

语音识别研究方向

發布時間：2023/12/20 编程问答 51 豆豆

生活随笔收集整理的這篇文章主要介紹了语音识别研究方向小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

遠場語音識別
? ? 1）語音激活檢測（VAD）?
```
需求背景：在近場識別場景，比如使用語音輸入法時，用戶可以用手按著語音按鍵說話，結束之后松開，由于近場情況下信噪比（signal to noise ratio, SNR））比較高，信號清晰，簡單算法也能做到有效可靠。?但遠場識別場景下，用戶不能用手接觸設備，這時噪聲比較大，SNR下降劇烈，必須使用VAD了。
``` ?
2）語音喚醒（voice trigger，VT）
```
需求背景：在近場識別時，用戶可以點擊按鈕后直接說話，但是遠場識別時，需要在VAD檢測到人聲之后，進行語音喚醒，相當于叫這個AI（機器人）的名字，引起ta的注意，比如蘋果的“Hey Siri”，Google的“OK Google”，亞馬遜Echo的“Alexa”等
```
3）麥克風陣列（Microphone Array）
```
需求背景：在會議室、戶外、商場等各種復雜環境下，會有噪音、混響、人聲干擾、回聲等各種問題。特別是遠場環境，要求拾音麥克風的靈敏度高，這樣才能在較遠的距離下獲得有效的音頻振幅，同時近場環境下又不能爆音（振幅超過最大量化精度）。另外，家庭環境中的墻壁反射形成的混響對語音質量也有不可忽視的影響。
```

**語音增強（Speech Enhancement）**：
? ? 當語音信號被各種各樣的噪聲(包括語音)干擾甚至淹沒后，從含噪聲的語音信號中提取出純凈語音的過程。

**聲源定位（Source Localization）**：
使用麥克風陣列來計算目標說話人的角度和距離，從而實現對目標說話人的跟蹤以及后續的語音定向拾取

**去混響（Dereverberation）：**
聲波在室內傳播時，要被墻壁、天花板、地板等障礙物形成反射聲，并和直達聲形成疊加，這種現象稱為混響。

**車載語音識別難點**
```

車內語音識別的難點很多，除了多人說話的干擾，還有胎噪、風噪，以及經常處于離線情況。?據說有的公司專門在做車內降噪，還有些公司想通過智能硬件來解決，至少目前好像還沒有哪個產品解決好了這個問題，并且獲得了用戶的口碑稱贊的。
```

總結

以上是生活随笔為你收集整理的语音识别研究方向的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：房屋租赁管理系统基于SSM框架带视频
下一篇：百度云盘卸载不干净如何处理