Real-Time-Voice-Cloning(github声音克隆项目演示)
github項目地址
①檢查pytorch的安裝
②ffmpeg是做什么的,在哪里下載?怎么使用?
原文地址
ffmpeg是一個處理多媒體信息的框架,有視頻采集、視頻格式轉換、視頻抓圖、給視頻加水印等功能
requirements.txt
python項目中必須包含一個 requirements.txt 文件,用于記錄所有依賴包及其精確的版本號,以便新環境部署
切換到項目目錄,生成requirement.txt文件并查看
③Download Pretrained Models(預訓練模型)
預訓練模型作為包含所有三個模型(揚聲器編碼器、合成器、聲碼器)的檔案。
存檔帶有與存儲庫相同的目錄結構,您需要將其內容與存儲庫的根目錄合并。
下完pretrained.zip并解壓,有三個文件夾encoder、synthesizer、vocoder。
把這三個文件夾中的內容復制到項目中對應的三個同名文件夾中
④Test Configuration(測試配置)
python demo_cli.py
發現No module named 'librosa'
也就是說少了個librosa模塊(librosa是一個非常強大的python語音信號處理的第三方庫)
安裝:pip install librosa
發現No module named 'torch'????????安裝:pip install torch
發現No module named 'unidecode'????????安裝:pip install unidecode
發現No module named 'inflect'????????安裝:pip install inflect
發現No module named 'sounddevice'????????安裝:pip install sounddevice
都安裝完了,顯示如下
?⑤Download Datasets(數據集)
對于單獨使用工具箱,建議下載 LibriSpeech/train-clean-100
train-clean-100.tar.gz下好解壓,有一個LibriSpeech文件夾
在Real-Time-Voice-Cloning-master這個項目里面,自己建一個名為datasets的文件夾,將LibriSpeech文件夾放進去
終端切換到項目的當前目錄
運行:python demo_toolbox.py -d datasets
即可Launch the Toolbox(啟動工具箱)
在這過程中
發現No module named 'umap'????????
安裝:pip install umap-learn -i https://mirrors.ustc.edu.cn/pypi/web/simple
發現"Unable to import 'webrtcvad'???????
安裝:pip install webrtcvad
工具箱顯示如下?
總結
以上是生活随笔為你收集整理的Real-Time-Voice-Cloning(github声音克隆项目演示)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 对待人生观的态度
- 下一篇: android banner指示器高度,