日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

[2021 icas]PPG-BASED SINGING VOICE CONVERSION WITH ADVERSARIAL REPRESENTATION LEARNING

發(fā)布時間:2023/12/14 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 [2021 icas]PPG-BASED SINGING VOICE CONVERSION WITH ADVERSARIAL REPRESENTATION LEARNING 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作者:Li Zhonghao
會議:投稿2021 icassp
單位:bytedance

文章目錄

        • abstract
        • 1. introduction
        • 2. METHOD
          • 2.1 PPGs Encoder & decoder
          • 2.2 Mel Encoder
        • 2.3 singer confusion module
        • 2.4 Mel-Regressive Representation learning Module
        • 3. EXPERIMENTS
          • 3.1. Experimental Setup
          • 3.2 Ablation Test
          • 3.3 Noise Robustness

abstract

兩個encoder,一個編碼PPGs的文本信息,一個輸入mel譜編碼聲學(xué)和音樂信息;為了改善timbre和melody,另外有adversarial singer confusion module和mel-regressive 表征學(xué)習(xí)模塊。

1. introduction

在VC中,對于pitch,pause的修改是被允許的; 但是在SVC中,pitch,pause被認為是歌唱相關(guān),說話人無關(guān)的特征,應(yīng)該在轉(zhuǎn)換過程中被保留。

傳統(tǒng)的SVC方法基于平行數(shù)據(jù):參數(shù)生成結(jié)構(gòu)–GMM,GAN網(wǎng)絡(luò)
基于非平行數(shù)據(jù)的方法:VAE—用wavenet分別做encoder和decoder,用這么強大的一個網(wǎng)絡(luò)來做這件事情,可以在非平行數(shù)據(jù)上達到較好的效果?!?】引入domain confusion module從encoder output中解耦singer information?!?】沿用了domain confusion 的思路,進一步提出了pitch confusion module,可以從encoder outputs中移除picth信息,進而能夠通過F0值控制基頻包絡(luò)和韻律。還有一些其他基于VAE的方法在研究SVC,但是他們不能解決輸入音頻包含噪聲的情況。

PPGs(sun) 是一個好的文本特征,同時保留了速度信息。DBLSTM用PPGs做many-to-one的轉(zhuǎn)換【14】,【15】又進一步將這個方法擴展到many-to-many的轉(zhuǎn)換。

2. METHOD

2.1 PPGs Encoder & decoder
  • singing ASR:使用的是歌唱識別數(shù)據(jù)集,CTC loss訓(xùn)練的ASR,提取1467-d PPGs
  • look_up_tabel方式得到的speaker_embedding,GMM attention和stop token被引入
  • source song中提取LF0
  • decoder input:encoder_output + LF0 + spk_emb
    YYY是mel spec,ttt是stop token
    binary CE loss預(yù)測停止點
2.2 Mel Encoder
  • PPGs去除了音色信息,僅保留文本信息,但丟失了歌唱轉(zhuǎn)換需要的風(fēng)格(intonation-語調(diào),melody, emotion),因此用額外的mel encoder編碼這些信息。

  • 實驗發(fā)現(xiàn):mel encoder的輸出維度被設(shè)為最小,這樣可以更好的抑制source voice中的音色和sound noise。4 units在平衡 timbre, sound quality, and musical characters 音素時表現(xiàn)最好。

2.3 singer confusion module

  • 作用:為了加強轉(zhuǎn)換語音和source的音色相似度;此處嘗試過CBHG結(jié)構(gòu)的module,但是性能不穩(wěn)定,且很容易訓(xùn)崩
  • CtargetC_{target}Ctarget?是目標說話人的one-hot embedding
  • CtargetjC_{target}^jCtargetj?是第jjj幀預(yù)測的spk_emb,然后對N幀結(jié)果求平均
  • 訓(xùn)練分成兩步
  • (1)訓(xùn)練分類網(wǎng)絡(luò),以最小化LDL_DLD?
  • (2)訓(xùn)練conversion path:(singer 分類器參數(shù)不再更新),loss函數(shù)是下公式,說話人判別器根據(jù)encoder output的輸出判斷說話人身份

2.4 Mel-Regressive Representation learning Module

  • 測試發(fā)現(xiàn)加入singer confusion module,在解耦說話人身份之外,發(fā)音和音樂特征的表達被削弱了,因此加入額外的模塊,對學(xué)習(xí)的特征進行指導(dǎo)補充。
  • 訓(xùn)練階段L:將speaker embedding+mel encoder outputs拼音送入Mel-Regressive Representation learning Module,恢復(fù)mel,

    生成器的loss函數(shù)可以表示為

3. EXPERIMENTS

3.1. Experimental Setup

train-set:中文普通話歌唱數(shù)據(jù)集32.7h(9個female, 7個male),每個說話人平均1000句訓(xùn)練,10句evaluation。
test-set:訓(xùn)練集以外的20人,40個segment,
decoder:WaveRNN
singing ASR(SASR):20k hours數(shù)據(jù), 1467-d PPGs
參數(shù)設(shè)置:γ = 1.0, λ = 0.1

18個專業(yè)的音樂人進行聽測;測試了(1)自然度;(2)相似度;另外測試了客觀指標NCC(normalized cross-correlation,歸一化互相關(guān))—prediction和ground-truth之間的pitch匹配度;

3.2 Ablation Test


結(jié)論:

  • mel encoder改善了自然度,但是降低了timbre 相似度;
  • 加入singer confusion之后,相似度提升了,但是自然度下降了;
  • 再加入mel-regressive learning module之后,兩個觀測指標都得到提升;
  • 3.3 Noise Robustness

    對source加入不同信噪比的白噪聲,性能損失很少(信噪比表明聲音的清晰度)

    總結(jié)

    以上是生活随笔為你收集整理的[2021 icas]PPG-BASED SINGING VOICE CONVERSION WITH ADVERSARIAL REPRESENTATION LEARNING的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 一道本在线播放 | 天堂中文在线官网 | 狠狠狠狠狠狠干 | 久久久久久国产 | 色婷婷国产精品综合在线观看 | 波多野结衣亚洲天堂 | 一级做a爰片毛片 | 欧美日韩一区二区三区不卡视频 | 大陆av片 | 丝袜一区二区三区四区 | 37p粉嫩大胆色噜噜噜 | 成年人免费av | 成人国产免费视频 | 亚洲天堂av影院 | 国产夫妻在线 | 麻豆视频成人 | 一区二区三区在线视频免费观看 | 久久香蕉网 | 日韩五月 | 激情成人综合 | 1区2区3区在线观看 久久久久久久久久久影院 成人网址在线观看 | 少妇人妻偷人精品无码视频 | 亚洲第一页av | 在线免费观看一级片 | 日韩在线观看第一页 | 96视频在线观看 | 俄罗斯美女av | 中文字幕欧美亚洲 | 这里只有精品免费视频 | 涩涩亚洲 | 91一二区| 久久久久久久久久久影视 | 成人性生交大片免费看r链接 | 国产素人在线观看 | 美女扒开腿让男人捅 | 免费在线观看黄色 | 性开放耄耋老妇hd | 久久精品中文字幕 | 亚洲成成品网站 | 大奶av | 风间由美av在线 | 在线免费看黄色片 | a级片网站 | 国产精品对白刺激久久久 | 天天精品视频 | 亚洲小视频在线观看 | 在线看的免费网站 | 日本人妻一区二区三区 | 欧美成人精品三级网站 | 99精品一区二区三区无码吞精 | 亚洲性猛交富婆 | 婷婷激情小说 | 99成人免费视频 | 日韩免费一级 | 欧美人与动牲交xxxxbbbb | 一区二区视频国产 | 日韩一级欧美一级 | 亚洲伦理精品 | 亚洲乱码国产乱码精品精 | 91成人免费在线观看视频 | 日本欧美国产一区二区三区 | 午夜av片| a级一片| 亚洲精品国产精品乱码不99 | 国产高清黄色 | 91影院在线观看 | 朝桐光av在线 | 在线观看高清av | 99er热精品视频 | 在线观看免费高清在线观看 | 国产一级二级三级精品 | 啪啪导航| heyzo亚洲| 国产高清成人 | 亚洲大尺度在线观看 | 四虎影视成人 | 免费在线观看黄视频 | 亚洲深夜福利视频 | 梦梦电影免费高清在线观看 | 免费看h网站 | 特黄一区 | 欧美中文字幕视频 | 久久精品天天中文字幕人妻 | 国产三级三级三级三级三级 | 国产亚洲成人精品 | 国产毛片不卡 | 羞辱狗奴的句子有哪些 | 国产免费一区视频观看免费 | 91综合久久| 吞精囗交69激情欧美 | 最新中文字幕在线 | 美女100%无挡| 亚洲卡一卡二卡三 | 日本成人一二三区 | 乱子伦一区二区三区 | 在线免费视频观看 | 日本人添下边视频免费 | 一级视频在线免费观看 | 深夜av在线 |