日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

语音信号处理疑惑与解答

發布時間:2023/12/8 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 语音信号处理疑惑与解答 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

語音信號處理疑惑與解答

  • 什么是梅爾倒譜
  • 聲道形狀如何描述
  • 頻譜是什么
  • 什么是聲譜圖
  • 什么共振峰
  • 倒譜的求解過程
  • mel頻率是什么
  • 如何求解梅爾倒譜系數
  • 1. 什么是語音識別
  • 2. 什么是信道
  • 3. 什么是加性噪聲
  • 4. 什么是乘性噪聲
  • 5. 什么是信道畸變


什么是梅爾倒譜

  • 基于聲音頻率的非線性梅爾刻度的對數能量譜的線性變換

聲道形狀如何描述

聲道的形狀在語音短時功率譜的包絡顯示出來,MFCC就是描述該包絡形狀的一種特征。

頻譜是什么

頻譜表示頻率與能量的關系。頻譜分為三種:線性振幅譜,對數振幅譜,自功率譜
幅度譜表示時間與能量的關系

什么是聲譜圖

連續的一幀幀的頻譜構成聲譜圖

什么共振峰

共振峰指聲音的頻譜中能量相對集中的一些區域,共振峰不但是音質的決定因素,而且反應了聲道(共振腔)的物理特征

倒譜的求解過程

信號->頻譜(DFT)->頻譜絕對值化(幅度取模)->對數譜(去ln)-> 倒譜(IDFT)

mel頻率是什么

基于人的聽覺感知系統,人耳對對頻率具有選擇性,人耳對低頻比較敏感,對高頻相對不敏感從而抑制。因此人耳的對頻率的感知是非線性的,然而在mel域,人耳對頻率的感知能力是線性的,從而有利于有利于分析信號。
mel(f)=2595log10(1+f700)mel(f)=2595log_{10}(1+\frac{f}{700})mel(f)=2595log10?(1+700f?)

如何求解梅爾倒譜系數

信號->頻譜(DFT)->頻譜絕對值化(幅度取模)->mel譜(mel濾波器組)->對數譜(去ln)-> 倒譜(IDFT)

1. 什么是語音識別

語音識別是將語音信號轉變為文字的過程。

2. 什么是信道

信道就是語音傳輸的外界環境,傳輸信息的通道。如A對B說話,A說出口的聲波到達B耳朵里的這段路程,就是信道。

3. 什么是加性噪聲

加性噪聲是相對于乘性噪聲來說,我們知道,聲音經過信道由一個地方傳輸到另外一個地方,可以把信號看成一個系統,根據《信號與系統》知,y(t)=x(t)?h(t)+v(t)y(t)=x(t)*h(t)+v(t)y(t)=x(t)?h(t)+v(t),其中t為時間,y(t)為經過信道傳輸后接受到的信號,x(t)為原始語音信號,h(t)的信道的系統函數,而信道中不是干凈的,總含有一些雜波,這些雜波為v(t),則v(t)的加性噪聲。由上可知,加性噪聲是一直存在的,不受h(t)的制約。而如果信道隨時間發生改變,則會出現乘性噪聲,即乘性噪聲一般描述系統的時變性。
如果信道h(t)發生了改變,則稱為信道畸變,如兩個大小不同的房間,則其信道是不一樣的。

4. 什么是乘性噪聲

見問題3

5. 什么是信道畸變

見問題3

  • 聲波是一種縱波,即震動方向與傳播方向保持一致。橫波的特點是質點的振動方向與波的傳播方向垂直。
  • 頻率是單位時間內聲波的周期數。
  • 波長是兩個波峰之間的距離,波長 = 傳播速度/頻率
  • 聲波的物理表現形式為頻率和振幅。頻率代表音高,振幅代表響度,頻率越大,音高越大,振幅越大,響度越高。振幅與頻率沒有必然關系
  • 純音:僅含有基頻;復合音:基頻+倍頻;和弦:基因與倍音共同組成。
    • 共振峰
  • 聲帶在震動過程中,產生基因與倍音
  • 聲道的固有頻率為共振峰頻率,簡稱共振峰。
  • 口腔比較柔軟,因此阻尼系數較高,因此會產生很多共振頻率。而無阻尼的共鳴器,只對一個頻率產生共鳴。
  • 不同的元音是由于口腔的形狀不同而產生不同的共鳴器,即不同的共振峰
  • 共振峰有多個
  • 聲道是一諧振腔,其隨舌頭和唇的震動而改變腔體,進而改變諧振頻率。若聲道的截面是均勻的,則諧振頻率將發生在,式中,c為聲速,n為諧振頻率號,L為聲道長度:
    Fn=(2n?1)c4L,n=1,2,3,4...F_n = \frac{(2n-1)c}{4L},\quad n=1,2,3,4...Fn?=4L(2n?1)c?,n=1,2,3,4...
  • 總結

    以上是生活随笔為你收集整理的语音信号处理疑惑与解答的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。