當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Real-Time-Voice-Cloning（github声音克隆项目演示）

發布時間：2024/3/13 编程问答 51 豆豆

生活随笔收集整理的這篇文章主要介紹了 Real-Time-Voice-Cloning（github声音克隆项目演示）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

github項目地址

①檢查pytorch的安裝

②ffmpeg是做什么的，在哪里下載？怎么使用？

原文地址

ffmpeg是一個處理多媒體信息的框架，有視頻采集、視頻格式轉換、視頻抓圖、給視頻加水印等功能

requirements.txt

python項目中必須包含一個 requirements.txt 文件，用于記錄所有依賴包及其精確的版本號，以便新環境部署

切換到項目目錄，生成requirement.txt文件并查看

③Download Pretrained Models（預訓練模型）

預訓練模型作為包含所有三個模型（揚聲器編碼器、合成器、聲碼器）的檔案。

存檔帶有與存儲庫相同的目錄結構，您需要將其內容與存儲庫的根目錄合并。

下完pretrained.zip并解壓，有三個文件夾encoder、synthesizer、vocoder。

把這三個文件夾中的內容復制到項目中對應的三個同名文件夾中

④Test Configuration（測試配置）

python demo_cli.py

發現No module named 'librosa'

也就是說少了個librosa模塊（librosa是一個非常強大的python語音信號處理的第三方庫）

安裝：pip install librosa

發現No module named 'torch'????????安裝：pip install torch

發現No module named 'unidecode'????????安裝：pip install unidecode

發現No module named 'inflect'????????安裝：pip install inflect

發現No module named 'sounddevice'????????安裝：pip install sounddevice

都安裝完了，顯示如下

?⑤Download Datasets（數據集）

對于單獨使用工具箱，建議下載 LibriSpeech/train-clean-100

train-clean-100.tar.gz下好解壓，有一個LibriSpeech文件夾

在Real-Time-Voice-Cloning-master這個項目里面，自己建一個名為datasets的文件夾，將LibriSpeech文件夾放進去

終端切換到項目的當前目錄

運行：python demo_toolbox.py -d datasets

即可Launch the Toolbox（啟動工具箱）

在這過程中

發現No module named 'umap'????????

安裝：pip install umap-learn -i https://mirrors.ustc.edu.cn/pypi/web/simple

發現"Unable to import 'webrtcvad'???????

安裝：pip install webrtcvad

工具箱顯示如下?

以上是生活随笔為你收集整理的Real-Time-Voice-Cloning（github声音克隆项目演示）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。