语音特征提取: MFCC的理解
生活随笔
收集整理的這篇文章主要介紹了
语音特征提取: MFCC的理解
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
文章目錄
- 1. 一般wav提取特征的方式:
- 2. 什么是MFCC:
- 3. 什么求倒譜:
- 4. 什么是頻譜的包絡:
- 5.如何獲取頻譜的包絡:
1. 一般wav提取特征的方式:
2. 什么是MFCC:
在mel-spectrum上取對數,再做傅里葉變換得到的特征,就是MFCCs。
這個過程可以概括為對mel-spectrum求倒譜。
3. 什么求倒譜:
求倒譜 就是對頻譜取對數,再做傅里葉變換,又回去了。
實際上是為了獲取頻譜的包絡,包絡這個東西是非常用途很廣。
4. 什么是頻譜的包絡:
就是頻譜里面主要頻率成分的連線的平滑曲線,就是一段聲音里面頻率振幅高的那些頻率的連線。
包絡就是頻率主要成分振幅的變化。
5.如何獲取頻譜的包絡:
包絡就是頻率主要成分振幅的變化。可以通過幅度解調的方法。就是這個變化是低頻的。
對頻譜做傅里葉變化,過濾低頻的成分,就是包絡的信息。
總結
以上是生活随笔為你收集整理的语音特征提取: MFCC的理解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: spring和mybatis整合:使用x
- 下一篇: Win10 ancona傻瓜安装tens