當(dāng)前位置:
首頁(yè) >
语音合成:transformer tts 论文复现以及dockerfile
發(fā)布時(shí)間:2024/3/13
49
豆豆
生活随笔
收集整理的這篇文章主要介紹了
语音合成:transformer tts 论文复现以及dockerfile
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
Transformer-TTS
- 基于pytorch復(fù)現(xiàn)的論文 Neural Speech Synthesis with Transformer Network
- 這個(gè)模型合成速度比tacotron快3-4倍,合成質(zhì)量也比較高。每步大概需要0.5秒。
- 沒(méi)有使用wavenet聲碼器,使用tacotron的CBHG模型,使用griffin-lim算法將頻譜圖轉(zhuǎn)換為原始波。
- model結(jié)構(gòu)
- [外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來(lái)直接上傳(img-tL3EG5JP-1593704300755)(https://i.loli.net/2020/07/01/QB5aAbrcLNtTuFR.png)]
Requirements
- Install python 3
- Install pytorch == 0.4.0
- Install requirements:
Data
- LJspeech
Pretrained Model
總結(jié)
以上是生活随笔為你收集整理的语音合成:transformer tts 论文复现以及dockerfile的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 如何评价腾讯发布的区块链游戏《一起来捉妖
- 下一篇: 3位Committer,12场国内外技术