日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数字语音信号处理学习笔记——语音信号的短时时域分析(4)

發布時間:2025/3/12 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数字语音信号处理学习笔记——语音信号的短时时域分析(4) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

版權聲明:本文為博主原創文章,未經博主允許不得轉載。?? ?https://blog.csdn.net/u013538664/article/details/26141939
3.7 基于能量和過零率的語音端點檢測??????

????????在復雜的應用環境下,從信號流中分辨出語音信號和非語音信號,是語音處理的一個基本問題。語音端點檢測就是指從包含語音的一段信號中確定出語音的起始點和結束點。正確的端點檢測對于語音識別和語音編碼系統都有重要的意義,它可以使采集的數據真正是語音信號的數據,從而減少數據量和運算量并減少處理時間。

??????判別語音段的起始點和終止點的問題主要歸結為區別語音和噪聲的問題。如果能夠保證系統的輸入信噪比很高(即使最低電平的語音的能量也比噪聲能量要高),那么只要計算輸入信號的短時能量就基本能夠把語音段和噪聲背景區別開來。但是,在實際應用中很難保證這么高的信噪比,僅僅根據能量來判斷是比較粗糙的。因此,還需進一步利用短時平均過零率進行判斷,因為清音和噪聲的短時平均過零率比背景噪聲的平均過零率要高出好幾倍。這次主要介紹基于能量和過零率的語音端點檢測方法——兩級判別法。

??????兩級判別法采用雙門限比較法,如圖:

??????

??????第一級判決:

??????1.先根據語音短時能量的輪廓選取一個較高的門限T1,進行一次粗判:語音起止點位于該門限與短時能量包絡交點所對應的時間間隔之外(即AB段之外)。

??????2.根據背景噪聲的平均能量確定一個較低的門限T2,并從A點往左、從B點往右搜索,分別找到短時能量包絡與門限T2相交的兩個點C和D,于是CD段就是用雙門限方法根據短時能量所判定的語音段。

??????第二級判決:

?????以短時平均過零率為標準,從C點往左和從D點往右搜索,找到短時平均過零率低于某個門限T3的兩個點E和F,這便是語音段的起止點。門限T3是由背景噪聲的平均過零率所確定的。

?????這里要注意,門限T2,T3都是由背景噪聲特性確定的,因此,在進行起止點判決前,通常都要采集若干幀背景噪聲并計算其短時能量和平均過零率,作為選擇T2和T3的依據。當然,T1,T2,T3,三個門限值的確定還應當通過多次實驗。

3.8 基音周期估值

???????基音周期是表征語音信號本質特征的參數,屬于語音分析范疇,只有準確分析并且提取出語音信號的特征參數,才能夠利用這些參數進行語音編碼、語音合成和語音識別等處理。語音編碼的壓縮率高低、語音合成的音質好壞及語音識別率的高低,也依賴于語音信號分析的準確性和精確性。因此基音周期估值在語音信號處理應用中具有十分重要的作用。語音信號基音周期估值的方法很多,最基本的方法有:基于短時自相關法的基音周期估值和基于短時平均幅度差函數的基音周期估值。

基于短時自相關法的基音周期估值:

???????如果x(n)是一個周期為P的信號,則其自相關函數也是周期為P的信號,且在信號周期的整數倍處,自相關函數取最大值。語音的濁音信號具有準周期性,其自相關函數在基音周期的整數倍處取最大值。計算兩相鄰最大峰間的距離,就可以估計出基音周期。觀察濁音信號的自相關函數圖,其中真正反映基音周期的只是其中少數幾個峰,而其余大多數峰都是由于聲道的共振特性引起的。因此,為了突出反映基音周期的信息,同時壓縮其他無關信息,減少運算量,有必要對語音信號進行適當預處理后再進行自相關計算以獲得基音周期。

基于短時平均幅度差函數AMDF法的基音周期估值:

???????如果信號x(n)是標準的周期信號,則相距為周期的整數倍的樣點上的幅度值是相等的,二者差值為零。對于濁音語音,在基音周期的整數倍上,這個差值不是零,但總是很小,因此,我們可以通過計算短時平均幅度差函數中兩相鄰谷值間的距離來進行基音周期估值。

基音周期估值的后處理:

???????語音信號中的濁音信號的周期性從波形上觀察可以看得很明顯,但是其形狀比較復雜,這使得基音檢測算法很難做到處處準確可靠。在提取基音的過程中,無論采用哪種方法提取的基音頻率軌跡與真實的基音頻率軌跡都不可能完全吻合。實際情況是大部分段落吻合,而在一些局部段落和區域中有一個或幾個基音頻率估計值偏離,甚至遠離正常軌跡,通常是偏離到正常值的2倍或1/2處,即實際基音頻率的倍頻或分頻處,稱這種偏離點為基音軌跡的“野點”。

???????為了去除這些“野點”,對求得的基音軌跡進行平滑后處理是非常必要的。語音信號的基頻通常是連續緩慢變化的,因此,用某種平滑技術來糾正這些“野點”是可以的。常用的平滑技術主要有:中值濾波平滑處理、線性平滑、動態規劃平滑處理。

????????


---------------------?
作者:JameJuZhang?
來源:CSDN?
原文:https://blog.csdn.net/jojozhangju/article/details/26141939?
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!

總結

以上是生活随笔為你收集整理的数字语音信号处理学习笔记——语音信号的短时时域分析(4)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。