MockingBrid(AI拟声)教程
該代碼:用來模仿別人說話生成的一段語音的代碼。
源碼地址:GitHub - babysor/MockingBird: 🚀AI擬聲: 5秒內克隆您的聲音并生成任意語音內容 Clone a voice in 5 seconds to generate arbitrary speech in real-time?
IDE:Pycharm2019
下載后的工程目錄:
encoder:編碼器
synthesizer:生成器
toolbox:ui工具箱
vocoder:解碼器
如果只需要使用的話:這些都不用管,可以直接使用別人的預訓練model.
環境安裝:
輸入:pip install requirements.txt
預模型下載:
????????github源碼中提供了一些用戶預訓練出來的模型。當然你也可以使用自己制作的數據集,那個github中有講解,這里我就不寫了,有點費時間。使用別人的模型就好了。?
選擇一個用戶的文件進行下載。
下載完成之后將其中的模型文件,依次保存到
synthesizer,encoder,vocoder三個文件中。如下圖所示
?
運行
????????運行:demo_toolbox.py ----------彈出UI窗口:[中文界面]
????????
之后將其中的配置改為這個樣子:并且在Browse中導入自己要模仿的音頻信息或者使用Record進行錄制音頻信息。
Synthesizer和vocoder是可以選擇的,Encoder就一個。
MaxLength是一句話的最長長度,如果太短了,會出現被截斷的聲音。
最后在該文本框中輸入,你要模仿的文本信息,并點擊Synthesize and vecode?
之后就可以聽到Ai仿生的效果了。
如果要保存仿生后的音頻文件,點擊Export進行保存。
音頻剪輯工具
這里對于音頻的信息進行剪切和格式轉換,推薦一個免費的網站。
Online MP3 Cutter - Cut Songs, Make Ringtones
非常好用,而且免費,不會和其他軟件一樣要沖會員,也不會加進去一段機械音。
總結
以上是生活随笔為你收集整理的MockingBrid(AI拟声)教程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是UN38.3认证_UN38.3测试
- 下一篇: AI 趋势