数字语音信号处理学习笔记——语音信号的短时时域分析(1)
版權聲明:本文為博主原創文章,未經博主允許不得轉載。?? ?https://blog.csdn.net/u013538664/article/details/25392889
3.1 概述
????語音信號是一種非平穩的時變信號,它攜帶著各種信息。在語音編碼、語音合成、語音識別和語音增強等語音處理中都需要提取語音中包含的各種信息。一般而言語音處理的目的有兩種:一種是對語音信號進行分析,提取特征參數,用于后續處理;另一種是加工語音信號,例如在語音增強中對含噪語音進行背景噪聲抑制,以獲得相對“干凈”的語音;在語音合成方中需要對分段語音進行拼接平滑,獲得主觀音質較高的合成語音,這方面的應用同樣是建立在分析并提取語音信號信息的基礎上的。總之,語音信號分析的目的就在于方便有效地提取并表示語音信號所攜帶的信息。
???????根據所分析的參數類型,語音信號分析可以分成時域分析和變換域(頻域、倒譜域)分析。其中時域分析方法是最簡單、最直觀的方法,它直接對語音信號的時域波形進行分析,提取的特征參數主要有語音的短時能量和平均幅度、短時平均過零率、短時自相關函數和短時平均幅度差函數等。
3.2 語音信號的預處理?
???????實際的語音信號是模擬信號,因此在對語音信號進行數字處理之前,首先要將模擬語音信號s(t)以采樣周期T采樣,將其離散化為s(n),采用周期的選取應根據模擬語音信號的帶寬(依奈奎斯特采樣定理)來確定,以避免信號的頻域混疊失真。在對離散后的語音信號進行量化處理過程中會帶來一定的量化噪聲和失真。
???????有了語音數據文件后,對語音的預處理包括:預加重和加窗分幀等。
3.2.1 語音信號的預加重處理
???????對輸入的數字語音信號進行預加重,其目的是為了對語音的高頻部分進行加重,去除口唇輻射的影響,增加語音的高頻分辨率。一般通過傳遞函數為的一階FIR高通數字濾波器來實現預加重,其中a為預加重系數,。設n時刻的語音采樣值為x(n),經過預加重處理后的結果為,這里a=0.98。
???????以下是預加重前和預加重后的一段濁音信號及頻譜,可以看出,預加重后的頻譜在高頻部分的幅度得到了提升。
???????
3.2.2 語音信號的加窗處理
進行預加重數字濾波處理后,接下來進行加窗分幀處理。語音信號是一種隨時間而變化的信號,主要分為濁音和清音兩大類。濁音的基音周期、清濁音信號幅度和聲道參數等都隨時間而緩慢變化。由于發聲器官的慣性運動,可以認為在一小段時間里(一般為10~30ms)語音信號近似不變,即語音信號具有短時平穩性。這樣,可以把語音信號分為一些短段(稱為分析幀)來進行處理。語音信號的分幀是采用可移動的有限長度窗口進行加權的方法來實現的。一般每秒的幀數為33~100幀,視實際情況而定。分幀雖然可以采用連續分段的方法,但一般要采用交疊分段的方法,這是為了使幀與幀之間平滑過渡,保持其連續性。前一幀和后一幀的交疊部分稱為幀移,幀移與幀長的比值一般取0~1/2。
常用的窗有兩種,一種是矩形窗,窗函數如下:
????????
???????
另一種是漢明(Hamming)窗,窗函數如下:
???
????
注:矩形窗的主瓣寬度小于漢明窗,具有較高的頻譜分辨率,但是矩形窗的旁瓣峰值較大,因此其頻譜泄漏比較嚴重。相比較,雖然漢明窗的主瓣寬度較寬,約大于矩形窗的一倍,但是它的旁瓣衰減較大,具有更平滑的低通特性,能夠在較高的程度上反映短時信號的頻率特性。
???????在確定了窗函數以后,對語音信號的分幀處理,實際上就是對各幀進行某種變換或運算。設這種變換或運算用T[]表示,x(n)為輸入語音信號,w(n)為窗序列,h(n)是與w(n)有關的濾波器,則各幀經處理后的輸出可以表示為:
???????
???????
????
---------------------?
作者:JameJuZhang?
來源:CSDN?
原文:https://blog.csdn.net/jojozhangju/article/details/25392889?
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!
總結
以上是生活随笔為你收集整理的数字语音信号处理学习笔记——语音信号的短时时域分析(1)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数字语音信号处理学习笔记——语音信号的数
- 下一篇: 数字语音信号处理学习笔记——语音信号的短