日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

基于深度前馈序列记忆网络,如何将语音合成速度提升四倍?

發布時間:2025/3/8 编程问答 14 豆豆
生活随笔 收集整理的這篇文章主要介紹了 基于深度前馈序列记忆网络,如何将语音合成速度提升四倍? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

研究背景

語音合成系統主要分為兩類,拼接合成系統和參數合成系統。其中參數合成系統在引入了神經網絡作為模型之后,合成質量和自然度都獲得了長足的進步。另一方面,物聯網設備(例如智能音箱和智能電視)的大量普及也對在設備上部署的參數合成系統提出了計算資源的限制和實時率的要求。本工作引入的深度前饋序列記憶網絡可以在保持合成質量的同時,有效降低計算量,提高合成速度。

我們使用基于雙向長短時記憶單元(BLSTM)的統計參數語音合成系統作為基線系統。與其他現代統計參數語音合成系統相似,我們提出的基于深度前饋序列記憶網絡(DFSMN)的統計參數語音合成系統也是由3個主要部分組成,聲音合成器(vocoder),前端模塊和后端模塊,如上圖所示。我們使用開源工具WORLD作為我們的聲音合成器,用來在模型訓練時從原始語音波形中提取頻譜信息、基頻的對數、頻帶周期特征(BAP)和清濁音標記,也用來在語音合成時完成從聲學參數到實際聲音的轉換。前端模塊用來對輸入的文本進行正則化和詞法分析,我們把這些語言學特征編碼后作為神經網絡訓練的輸入。后端模塊用來建立從輸入的語言學特征到聲學參數的映射,在我們的系統中,我們使用DFSMN作為后端模塊。

深度前饋序列記憶網絡

緊湊前饋序列記憶網絡(cFSMN)作為標準的前饋序列記憶網絡(FSMN)的改進版本,在網絡結構中引入了低秩矩陣分解,這種改進簡化了FSMN,減少了模型的參數量,并加速了模型的訓練和預測過程。

上圖給出了cFSMN的結構的圖示。對于神經網絡的每一個cFSMN層,計算過程可表示成以下步驟①經過一個線性映射,把上一層的輸出映射到一個低維向量②記憶模塊執行計算,計算當前幀之前和之后的若干幀和當前幀的低維向量的逐維加權和③把該加權和再經過一個仿射變換和一個非線性函數,得到當前層的輸出。三個步驟可依次表示成如下公式。

與循環神經網絡(RNNs,包括BLSTM)類似,通過調整記憶模塊的階數,cFSMN有能力捕捉序列的長程信息。另一方面,cFSMN可以直接通過反向傳播算法(BP)進行訓練,與必須使用沿時間反向傳播算法(BPTT)進行訓練的RNNs相比,訓練cFSMN速度更快,且較不容易受到梯度消失的影響。

對cFSMN進一步改進,我們得到了深度前饋序列記憶網絡(DFSMN)。DFSMN利用了在各類深度神經網絡中被廣泛使用的跳躍連接(skip-connections)技術,使得執行反向傳播算法的時候,梯度可以繞過非線性變換,即使堆疊了更多DFSMN層,網絡也能快速且正確地收斂。對于DFSMN模型,增加深度的好處有兩個方面。一方面,更深的網絡一般來說具有更強的表征能力,另一方面,增加深度可以間接地增大DFSMN模型預測當前幀的輸出時可以利用的上下文長度,這在直觀上非常有利于捕捉序列的長程信息。具體來說,我們把跳躍連接添加到了相鄰兩層的記憶模塊之間,如下面公式所示。由于DFSMN各層的記憶模塊的維數相同,跳躍連接可由恒等變換實現。

我們可以認為DFSMN是一種非常靈活的模型。當輸入序列很短,或者對預測延時要求較高的時候,可以使用較小的記憶模塊階數,在這種情況下只有當前幀附近幀的信息被用來預測當前幀的輸出。而如果輸入序列很長,或者在預測延時不是那么重要的場景中,可以使用較大的記憶模塊階數,那么序列的長程信息就能被有效利用和建模,從而有利于提高模型的性能。

除了階數之外,我們為DFSMN的記憶模塊增加了另一個超參數,步長(stride),用來表示記憶模塊提取過去或未來幀的信息時,跳過多少相鄰的幀。這是有依據的,因為與語音識別任務相比,語音合成任務相鄰幀之間的重合部分甚至更多。

上文已經提到,除了直接增加各層的記憶模塊的階數之外,增加模型的深度也能間接增加預測當前幀的輸出時模型可以利用的上下文的長度,上圖給出了一個例子。

實驗

在實驗階段,我們使用的是一個由男性朗讀的中文小說數據集。我們把數據集劃分成兩部分,其中訓練集包括38600句朗讀(大約為83小時),驗證集包括1400句朗讀(大約為3小時)。所有的語音數據采樣率都為16k赫茲,每幀幀長為25毫秒,幀移為5毫秒。我們使用WORLD聲音合成器逐幀提取聲學參數,包括60維梅爾倒譜系數,3維基頻的對數,11維BAP特征以及1維清濁音標記。我們使用上述四組特征作為神經網絡訓練的四個目標,進行多目標訓練。前端模塊提取出的語言學特征,共計754維,作為神經網絡訓練的輸入。

我們對比的基線系統是基于一個強大的BLSTM模型,該模型由底層的1個全連接層和上層的3個BLSTM層組成,其中全連接層包含2048個單元,BLSTM層包含2048個記憶單元。該模型通過沿時間反向傳播算法(BPTT)訓練,而我們的DFSMN模型通過標準的反向傳播算法(BP)訓練。包括基線系統在內,我們的模型均通過逐塊模型更新過濾算法(BMUF)在2塊GPU上訓練。我們使用多目標幀級別均方誤差(MSE)作為訓練目標。

所有的DFSMN模型均由底層的若干DFSMN層和上的2個全連接層組成,每個DFSMN層包含2048個結點和512個投影結點,而每個全連接層包含2048個結點。在上圖中,第三列表示該模型由幾層DFSMN層和幾層全連接層組成,第四列表示該模型DFSMN層的記憶模塊的階數和步長。由于這是FSMN這一類模型首次應用在語音合成任務中,因此我們的實驗從一個深度淺且階數小的模型,即模型A開始(注意只有模型A的步長為1,因為我們發現步長為2始終稍好于步長為1的相應模型)。從系統A到系統D,我們在固定DFSMN層數為3的同時逐漸增加階數。從系統D到系統F,我們在固定階數和步長為10,10,2,2的同時逐漸增加層數。從系統F到系統I,我們固定DFSMN層數為10并再次逐漸增加階數。在上述一系列實驗中,隨著DFSMN模型深度和階數的增加,客觀指標逐漸降低(越低越好),這一趨勢非常明顯,且系統H的客觀指標超過了BLSTM基線。

另一方面,我們也做了平均主觀得分(MOS)測試(越高越好),測試結果如上圖所示。主觀測試是通過付費眾包平臺,由40個母語為中文的測試人員完成的。在主觀測試中,每個系統生成了20句集外合成語音,每句合成語音由10個不同的測試人員獨立評價。在平均主觀得分的測試結果表明,從系統A到系統E,主觀聽感自然度逐漸提高,且系統E達到了與BLSTM基線系統一致的水平。但是,盡管后續系統客觀指標持續提高,主觀指標只是在系統E得分的上下波動,沒有進一步提高。

結論

根據上述主客觀測試,我們得到的結論是,歷史和未來信息各捕捉120幀(600毫秒)是語音合成聲學模型建模所需要的上下文長度的上限,更多的上下文信息對合成結果沒有直接幫助。與BLSTM基線系統相比,我們提出的DFSMN系統可以在獲得與基線系統一致的主觀聽感的同時,模型大小只有基線系統的1/4,預測速度則是基線系統的4倍,這使得該系統非常適合于對內存占用和計算效率要求很高的端上產品環境,例如在各類物聯網設備上部署。

云服務器99元拼團購!拉新還可贏現金紅包!300萬等你瓜分!
馬上一鍵開團贏紅包: http://click.aliyun.com/m/100...


本文作者:研讀論文的

閱讀原文

本文來自云棲社區合作伙伴“阿里技術”,如需轉載請聯系原作者。

總結

以上是生活随笔為你收集整理的基于深度前馈序列记忆网络,如何将语音合成速度提升四倍?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 九色porny自拍视频在线播放 | 亚洲国产专区 | 草逼视频免费看 | 日韩精品美女 | 成人免费无码av | 亚洲视频一区在线 | 精品免费视频一区二区 | 精品国产乱码久久久久久蜜臀 | youjizz日本人 | 色福利在线 | 国产21页| 免费看美女被靠到爽的视频 | 小泽玛利亚在线 | 在线免费观看一区二区三区 | 国产一区二区成人 | 1024av在线| 久久久久18 | 欧美乱日| 东方伊甸园av在线 | 欧美乱妇视频 | 日本免费一区二区视频 | 日韩人妻无码精品综合区 | 91午夜精品亚洲一区二区三区 | 伊人久久久久久久久久久久久 | 日韩激情精品 | 操屁股视频 | 三上悠亚影音先锋 | 怨女1988国语版在线观看高清 | 久久久欧美| 成人性生活视频 | 亚洲一区二区观看播放 | 素人fc2av清纯18岁 | 成人免费视频一区二区三区 | 欧美猛操| 国产av无码国产av毛片 | 精品国产免费一区二区三区 | 国产爽爽爽 | 永久免费在线 | 亚洲欧美激情图片 | 天天色天天操天天射 | 国产成人精品一区二区三区在线观看 | 情趣五月天 | 可以免费看污视频的网站 | 日本激情视频在线 | 欧美另类视频 | av我不卡 | 日本久久爱 | 黄色免费网站在线 | 亚洲一二三四五 | 国产乱码精品一区二区三区五月婷 | 亚洲精品二三区 | 激情综合五月婷婷 | 五月婷av| 国内毛片视频 | www.欧美国产 | 毛片基地站| 国产免费麻豆 | 国产性―交一乱―色―情人 | 欧美人妻少妇一区二区三区 | 国产久久精品 | 国产国语性生话播放 | 免费看欧美黄色片 | 一区二区av | 久久国产精品亚洲 | 欧美巨大乳 | 欧美性开放视频 | 色哟哟无码精品一区二区三区 | 一区二区黄色 | 农村村妇真实偷人视频 | www.youjizz.com国产 | 欧美成人国产精品一区二区 | 啪啪啪一区二区 | 插插久久| 天天射天天操天天干 | 国产精品视频一区二区三 | 在线黄网站 | 琪琪电影午夜理论片八戒八戒 | 久久久精品人妻av一区二区三区 | 91传媒在线免费观看 | 国产成人精品777777 | 久久精品久久国产 | 成人亚洲精品777777ww | 欧美日韩国语 | 日本久久视频 | 欧美久久久久久 | 超碰成人97 | 日日碰狠狠添天天爽 | 日本亚洲欧美在线 | 又黄又色的网站 | 日韩精品在线一区二区三区 | 超碰免费看 | 日本一二三不卡 | 91精品人妻一区二区三区四区 | 国产刺激对白 | 里番精品3d一二三区 | 亚洲天堂777 | 精品一区二区久久久久蜜桃 | 天天干天 | 日韩av在线网站 |