语音合成:transformer tts 论文复现以及dockerfile
生活随笔
收集整理的這篇文章主要介紹了
语音合成:transformer tts 论文复现以及dockerfile
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Transformer-TTS
- 基于pytorch復現的論文 Neural Speech Synthesis with Transformer Network
- 這個模型合成速度比tacotron快3-4倍,合成質量也比較高。每步大概需要0.5秒。
- 沒有使用wavenet聲碼器,使用tacotron的CBHG模型,使用griffin-lim算法將頻譜圖轉換為原始波。
- model結構
- [外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-tL3EG5JP-1593704300755)(https://i.loli.net/2020/07/01/QB5aAbrcLNtTuFR.png)]
Requirements
- Install python 3
- Install pytorch == 0.4.0
- Install requirements:
Data
- LJspeech
Pretrained Model
總結
以上是生活随笔為你收集整理的语音合成:transformer tts 论文复现以及dockerfile的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何评价腾讯发布的区块链游戏《一起来捉妖
- 下一篇: 3位Committer,12场国内外技术