语音模型
1 語音生成系統(tǒng)
??? 發(fā)聲器官:聲帶,聲道?
??? 聲帶:聲音的激勵,開啟閉合一次形成濁音的激勵脈沖,其頻率為60-450hz,也稱為基音頻率
??? 聲道:從聲帶到嘴唇的呼吸通道,聲音的信道,決定一個人的聲紋
??? 人聲按照聲帶振動與否,分為濁音與清音
人聲發(fā)音原理:
a 聲帶開啟與閉合,產生一定頻率的激勵信號,通過聲道,產生濁音
b 聲帶不振動,由聲道(包括口腔、嘴唇等)變化產生聲音,并不是聲帶振動引起的聲音,為清音
2 語音生成 模型
2.1 語音激勵模型
a 濁音激勵模型,詳細公式見網址:http://www.cnblogs.com/tanglei-young/archive/2013/03/18/speech.html
? 聲帶不斷的張開與關閉,產生了間歇的脈沖波,也就是濁音的激勵信號。其時域波形為以基音周期為周期的斜三角脈沖波
b 清音的激勵模型
? 發(fā)清音時,聲道發(fā)生形狀變化形成的聲音,可以用白噪聲作為激勵。
? 單獨的將語音激勵分成清音和濁音兩種是不全面的,很多時候是清音與濁音混起來之后的混合激勵
2.2 聲道模型
a 元音:激勵順利的通過聲道,產生元音,要素有兩個,一是聲帶振動,二是氣流通過口腔、鼻腔不受阻(不同的元音是通過舌、唇的調節(jié)而發(fā)出不同的聲音)
b 輔音:激勵通過聲道時,聲道發(fā)生變化發(fā)出的聲音為輔音。這里要素也有兩個,一是與聲帶振動與否沒關系,二是氣流通過口腔時受到阻礙(即聲道發(fā)生變化)。
聲道可以看成一個諧振腔,聲道模型可以看成是一個共振峰模型,共振峰就是諧振腔中的諧振頻率。諧振腔可以改變原本語音的頻譜特性,在諧振頻率上能量加強,其他頻率上能量衰弱,有一定的濾波作用。能夠決定元音的音質,也反映的聲腔的頻率特性。
一般元音,可以用前三個共振峰去表示,而對于輔音、鼻音等則需要至少5個共振峰去表示。
一般元音可以用全極點模型來模擬,因為元音發(fā)音的口腔相對穩(wěn)定,一個音的后半部分具有一定的可預測性,其模型傳輸函數見上面的網址。
而輔音等則需要零極點模型來進行模擬,因為輔音或者鼻音等發(fā)音時,口腔會帶來一定的突變,因此,需要零極點模型去進行模擬,詳細公式見上面的網址。
總結
- 上一篇: 匹配中国人姓名的JavaScript正则
- 下一篇: 移动宽带光猫真正后台上网设置