MFCC 特征提取
HTK以及My_htk數據鏈接: https://pan.baidu.com/s/1Ajo7d-odrRiAwmCB_CQTzQ 提取碼:hqnv
一:文件準備
下載 HTK 和 HTK–samples 兩個壓縮文件,保存至 F 盤根目錄下。 下載地址:http://htk.eng.cam.ac.uk/download.shtml(注:HTK 官方 網站需要先注冊,才能下載)
安裝 Visual Studio 軟件, 我安裝的是 VS2013
二: HTK 編譯
1.創建 bin.win32 和運行 VS2013
進入到解壓后的 HTK-3.4.1 文件夾下的 htk 文件夾中,在本目錄下創 建一個名為 bin.win32 的文件夾,這個文件夾是用來存放 htk 生成的各個 exe 程序的。找到自己 VS 安裝目錄下 VC 的子目錄下的 bin 文件夾,將該路徑添加到 path 變量中。
在cmd中輸入 :path=%path%;F:\VS2013\VC\BIN即可 ( 注意不要加入不必要的空格 ) , 添加完成后繼續輸入 path, 看看有沒有添加成功 ( 末尾是否有剛添加的路徑 ) , 如果添加成功 , 輸入VCVARS32
2.進行編譯
進入到HTKLib目錄 :cd HTKLib, 在命令行里輸入nmake/f htk_htklib_nt.mkf all 進行編譯 , 輸入后 ,DOS窗口會出現如下情況 ( 截取其中部分 ):
在命令行中輸入 cd…, 表示返回上一層目錄 , 再輸入 cd HTKTools, 進入HTKTools目錄 , 輸入nmake/f htk_htktools_nt.mkf all 編譯該目錄下的文件 。
編譯 HLMLib
輸入cd…, 再輸入cd HLMLib, 進入HLMLib目錄 , 輸入 :nmake/f htk_hlmlib_nt.mkf all 編譯該目錄下的文件 。
編譯 HLMTools
輸入cd…, 再輸入cd HLMTools, 進入HLMTools目錄 , 輸入 :nmake/f htk_hlmtools_nt.mkf all 編譯該目錄下的文件 。
3.編譯驗證
這時候我們已經編譯完所有 exe 程序,我們打開 bin. win32 文件夾看 一下,如果如下圖所示,則證明已經編譯成功。
4.工具路徑加入到 path
為了能在DOS命令行中使用我們編譯生成的工具 , 要將生成的工具路徑加入到 path中。 在cmd中輸入path=%path%;F:\htk\bin.win32回車 , 再輸入path 查看添加后的結果如下 :
【 特別提醒 】: 最好在同一個DOS窗口實現所有步驟 , 否則可能不成功 。 如果下次需要特征提取 , 需要將path=%path%;F:\htk\bin.win32 回車添加進去 。
三: HTK 工具箱的使用(將 WAV 生成 MFCC 文件)
1. htk 文件準備
需要準備如下兩個文件(再同一文件夾下新建兩個 txt 文件,把文件內 容寫進去后,保存,再修改文件名即可):
- hcopy.conf
其中:hcopy.conf 文件是配置文件, 將下列內容粘貼進去即可,有可以 根據要求修改參數:
- hcopy.scp
第二個文件是輸入輸出文件:hcopy.scp (標明語音文件的地址和對應 輸出 mfcc 文件的地址, 提前建好一個 mfcc 文件夾)。hcopy.scp 文件 內容如下:
- ubm
ubm 文件里面就是需要提取特征的.wav 文件
2.mfcc 特征提取
在 DOS 窗口利用 HCopy 文件進行 mfcc 特征提取
命令:HCopy -A -D -C hcopy.conf -S hcopy.scp
我圖片演示的是第二次 HTK 的用法,如果是第一次就可以在同一個 DOS 窗口下輸入該命令
總結
- 上一篇: 说话人识别系统性能判断
- 下一篇: 基于FFT的信号频谱分析