日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

2022年2月语音合成(TTS)和语音识别(ASR)论文月报

發(fā)布時(shí)間:2024/1/8 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 2022年2月语音合成(TTS)和语音识别(ASR)论文月报 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

論文統(tǒng)計(jì)每月更新一次,主要跟蹤語(yǔ)音合成和語(yǔ)音識(shí)別的發(fā)展?fàn)顩r(很多文章都是在會(huì)議后才發(fā)出,但不影響統(tǒng)計(jì)。統(tǒng)計(jì)過程難免存在疏漏,因此統(tǒng)計(jì)結(jié)果僅供參考。所有文章語(yǔ)音合成領(lǐng)域統(tǒng)計(jì)列表請(qǐng)?jiān)L問http://yqli.tech/page/tts_paper.html,語(yǔ)音識(shí)別領(lǐng)域論文統(tǒng)計(jì)請(qǐng)?jiān)L問http://yqli.tech/page/asr_paper.html。如何查找語(yǔ)音資料請(qǐng)參考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。讀者有什么建議可以直接給我發(fā)消息,我將不斷修改該統(tǒng)計(jì)。如有轉(zhuǎn)載,請(qǐng)注明出處。歡迎關(guān)注微信公眾號(hào):低調(diào)奮進(jìn)。


?(二月份我分享文章有點(diǎn)少,主要最近手頭活沒干完,自己沒那么多精力閱讀)

一 語(yǔ)音合成篇

表一給出具體分類說明,表二為每種分類的具體情況。2022年2月的語(yǔ)音合成相關(guān)的文章有23篇,比1月份的情況還少,呈下降趨勢(shì)。但與2021年的1月份和2月份來說是增加了(圖1為2021年論文情況,不保證遺漏情況,2021年度具體參見https://mp.weixin.qq.com/s/507imeCyF8cyH6rSlVKr6A)。從表二的具體方向文章數(shù)量可知,聲學(xué)模型、歌唱和音樂合成、聲碼器和多模態(tài)的文章較多,尤其聲碼器lpcnet作者又發(fā)了兩篇關(guān)于lpcnet的文章。聲音轉(zhuǎn)換的文章跟去年一樣,但沒有預(yù)料的增長(zhǎng),更多工作趨向無監(jiān)督或者端到端的?方向研究。總體研究情況沒有出現(xiàn)特別亮眼的?系統(tǒng)。

表一? 語(yǔ)音合成分類說明?

分類

說明

前端

多音字,韻律,g2p等等。

聲學(xué)模型

語(yǔ)言特征轉(zhuǎn)聲學(xué)特征,attention工作,多說話人以及雙重學(xué)習(xí)

聲碼器

波形生成

個(gè)性化

少數(shù)據(jù),臟數(shù)據(jù)應(yīng)用等自適應(yīng)

多語(yǔ)言

多語(yǔ)言模型

歌唱合成

歌唱和音樂合成

情感

風(fēng)格和情感

多模態(tài)

主要搜集talking head文章

聲音轉(zhuǎn)換

基于GAN方案和特征解耦方案

S2S

?speech-to-speech

其它

基于EEG合成,開源數(shù)據(jù),MOS評(píng)測(cè)以及語(yǔ)音合成的應(yīng)用

表二 語(yǔ)音合成文章情況表(單位:篇)

篇數(shù)
1月27
2月23
1月2月
前端20
聲學(xué)模型45
聲碼器15
個(gè)性化12
多語(yǔ)言11
歌唱合成53
情感風(fēng)格22
多模態(tài)43
聲音轉(zhuǎn)換42
s2s10
其它20

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖1?2021年語(yǔ)音合成論文情況柱狀圖

語(yǔ)音合成的文章列表請(qǐng)?jiān)L問http://yqli.tech/page/tts_paper.html

2022.02月份的文章

二?語(yǔ)音識(shí)別篇

語(yǔ)音識(shí)別的文章分類參照表三說明。表四為每個(gè)方向的具體文章數(shù)據(jù)量和本月的文章總量,其中2月份ASR相關(guān)的文章有44篇,比1月份相對(duì)增長(zhǎng),尤其一些參加比賽的文章比較多,比如M2MeT?等等。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 表三? 語(yǔ)音識(shí)別分類說明?

分類

說明

general

包括傳統(tǒng)、混合語(yǔ)音識(shí)別,以及對(duì)asr的優(yōu)化

ctc

ctc優(yōu)化

rnn-t

rnn-t的優(yōu)化

aed

aed優(yōu)化

dataset

開源數(shù)據(jù)庫(kù)

data aug

數(shù)據(jù)增廣

lm

語(yǔ)言模型研究

multilingual

多語(yǔ)音系統(tǒng)以及code-switch

personal

少數(shù)據(jù)量自適應(yīng)以及個(gè)性化ASR

rescoring

多種模型聯(lián)合打分

unsupervised

無監(jiān)督或者自監(jiān)督學(xué)習(xí)

accent?,dialect

口音和方言

other

其它方向研究,包括系統(tǒng)評(píng)價(jià)標(biāo)準(zhǔn)等等

robust魯棒性
multichannel多通道

?

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?表四? 語(yǔ)音識(shí)別文章數(shù)量統(tǒng)計(jì)(單位:篇)

篇數(shù)
1月35
2月44
1月2月
general1210
ctc10
rnn-t31
aed11
dataset30
data augmentation11
lm22
multilingual21
personal07
rescoring11
unsupervised23
accent10
multichannel04
robust00
other613

?

語(yǔ)音識(shí)別的文章列表請(qǐng)?jiān)L問http://yqli.tech/page/asr_paper.html

2022.02月份語(yǔ)音識(shí)別具體文章

總結(jié)

以上是生活随笔為你收集整理的2022年2月语音合成(TTS)和语音识别(ASR)论文月报的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。