日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Chapter1-3_Speech_Recognition(CTC, RNN-T and more)

發(fā)布時間:2024/7/5 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Chapter1-3_Speech_Recognition(CTC, RNN-T and more) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

文章目錄

    • 1 CTC
    • 2 RNN-T
    • 3 Neural Transducer
    • 4 Monotonic Chunkwise Attention
    • 5 小結(jié)

本文為李弘毅老師【Speech Recognition - CTC, RNN-T and more】的課程筆記,課程視頻youtube地址,點這里👈(需翻墻)。

下文中用到的圖片均來自于李宏毅老師的PPT,若有侵權(quán),必定刪除。

文章索引:

上篇 - 1-2 LAS

下篇 - 1-4 HMM

總目錄

1 CTC

CTC源于論文Connectionist Temporal Classification: Labelling Unsegmented
Sequence Data with Recurrent Neural Networks,是用來訓(xùn)練RNN的一種方法,它被廣泛應(yīng)用于一些標(biāo)簽未與輸入對齊的任務(wù)中,如語音識別、圖像文本識別等等。說簡單點,就比如我們今天有一段語音"Hello",然后我們的標(biāo)簽一般來說只會是"Hello"這樣幾個字符,從標(biāo)簽中,我們無法知道語音的哪幾秒對應(yīng)了"H",哪幾秒對應(yīng)了"e"。所以當(dāng)我們的Encoder輸出一個長度和輸入相等為TTT的序列時,我們沒法和標(biāo)簽對齊,也就沒法去算這個loss。當(dāng)然,我們可以再加一個RNN的decoder來解決問題,但我們也可以減小一些模型的大小,直接利用CTC來處理Encoder的輸出。

沒錯,利用CTC來計算loss的話,我們只需要Encoder就可以了。不過這個時候,我們每個time step的輸出要比vocabulary的size大1,這多出來的一個就是CTC需要的間隔符,這里記作?\phi?

這個?\phi?是我們?nèi)藶榧舆M去的,出現(xiàn)在模型輸出的結(jié)果中,但不應(yīng)該出現(xiàn)在最終得到的結(jié)果當(dāng)中,因為vacabulary里是沒有這個?\phi?的。所以,在解析模型輸出結(jié)果的時候,我們定義了如下兩條規(guī)則:

  • 首先合并所有的相鄰重復(fù)字符
  • 然后去除掉所有的?\phi?

哦,對了,還有一條規(guī)則,這個是在構(gòu)建模型和數(shù)據(jù)集的時候需要注意的:

  • label的長度必須不大于模型輸出的長度

實際情況下,label的長度最好是遠小于模型輸出的長度,因為label中有重復(fù)字符的話,模型的輸出就必須加入額外的?\phi?才可能解析出和label一樣的結(jié)果。

如下是幾個轉(zhuǎn)化的例子:

從上面的例子也不難推斷出,模型不同的輸出也可以得到相同的結(jié)果,比如下圖左邊的三種輸出都可以解析得到相同的文字。CTC在訓(xùn)練的時候會去窮舉所有可能的對齊方式。

也正是因為CTC的這些特性,模型classifier(第一張圖??)的每一個time step的最終輸出結(jié)果是獨立的,在面對有很多重復(fù)的輸入時,CTC很容易壞掉。

為了解決這個問題,有人提出了一種叫做RNA(Recurrent Neural Aligner)的方法。它就是把CTC獨立的classifier換成了一個RNN就結(jié)束了。這樣模型在輸出token的時候,就可以參考前面的輸出了。

不過,這樣還有一個問題,就是面對一個輸入,需要有多個輸出的時候,該怎么辦?比如“th”的發(fā)音只有一個音節(jié),但是輸出卻有兩個字母。這個時候就輪到RNN-T出場了。

2 RNN-T

RNN-T出自論文Sequence Transduction with Recurrent Neural Networks。它在RNA的基礎(chǔ)上做了改進,解決了上述一對多的問題。它的改進在于,每個time step產(chǎn)生輸出的時候,一直要等到模型輸出了?\phi?,才會繼續(xù)去看下一個time step的內(nèi)容,如下圖所示。

所以,RNN-T的運算流程是長這個樣子的。輸入sequence的長度有多長,那么就會產(chǎn)生多少個?\phi?

而實際的RNN-T,還會再多做一步,就是它會以輸出的token為輸入,加了一個RNN的模型去影響輸出的token,如下圖所示。不過,這個RNN會無視?\phi?

這里多加入的RNN模型可以看成一個language model,可以先單獨train好再拿進來。

3 Neural Transducer

Neural Transducer又繼續(xù)做了優(yōu)化,就是每次不是只看一個time step的hidden state來進行輸出,而是看一個長度為www的窗口內(nèi)的hidden states來做attention,之后再塞進RNN里去得到token,輸出?\phi?后再看下一個窗口。這個有些細節(jié)我也沒去細看,李老師也只是略講了一下,這里就當(dāng)了解一下吧。

4 Monotonic Chunkwise Attention

MoCha(Monotonic Chunkwise Attention)也是略講了一下,它就是一個窗口可以自由選擇移動的Neural Transducer,這里我也偷下懶不說了。

5 小結(jié)

結(jié)合上篇所講的LAS,現(xiàn)在一共講了6個模型。

  • LAS:就是seq2seq的標(biāo)準(zhǔn)模型
  • CTC:decoder是linear classifier的seq2seq模型
  • RNA:輸入一個東西就要輸出一個東西的seq2seq模型
  • RNN-T:輸入一個東西,可以輸出多個東西的seq2seq模型
  • Neural Transducer:每次輸入一個window的RNN-T
  • MoCha:window移動伸縮自如的Neural Transducer

總結(jié)

以上是生活随笔為你收集整理的Chapter1-3_Speech_Recognition(CTC, RNN-T and more)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 91精东传媒理伦片在线观看 | 色激情五月 | 欧美做受高潮动漫 | 国产精品激情偷乱一区二区∴ | 影音先锋在线播放 | 国产第一毛片 | 草逼网站 | 深喉口爆一区二区三区 | 五十路六十路七十路熟婆 | www.av777| 午夜视频网站 | 午夜av免费看 | 俺啪也| 亚洲无码一区二区三区 | 大又大又粗又硬又爽少妇毛片 | 成人看片黄a免费看视频 | 成人小视频免费在线观看 | 精品久久无码中文字幕 | 欧美一级在线免费 | 韩日午夜在线资源一区二区 | 蜜桃av在线播放 | 亚洲伊人婷婷 | 激情欧美一区二区三区 | 青春草在线视频观看 | 国产黄色网址在线观看 | 国产在线视频卡一卡二 | 尤物一区二区 | 欧美在线一二三四区 | 亚洲在线观看一区 | 欧美不卡三区 | 久久波多野 | 中文字幕一区二区三区夫目前犯 | 污导航在线 | 狠狠操一区二区 | 诱惑av| 9.1成人看片免费版 日韩经典在线 | 中文一二三区 | 免费观看亚洲 | 在线免费观看日韩视频 | 鲁一鲁av | 白浆一区 | 亚洲v在线 | 久久中文字幕人妻 | 五月网婷婷 | 国产不卡一区 | 亚洲一区二区蜜桃 | 精品人妻一区二区免费视频 | 麻豆av影院 | 风流少妇一区二区三区91 | 久久久久久91亚洲精品中文字幕 | 日韩美女做爰高潮免费 | 六月婷婷综合 | 六月婷婷网 | 亚洲AV无码久久精品国产一区 | 韩国一区二区三区视频 | 国产一区欧美 | 天堂av官网| 青青草视频在线免费观看 | 欧美mv日韩mv国产 | 黑人超碰 | 国产一区二 | 丁香婷婷在线观看 | 毛茸茸日本熟妇高潮 | 乱妇乱女熟妇熟女网站 | 欧美激情免费 | 伊在线久久丫 | 自拍视频网站 | 吃奶在线观看 | 久久久久99人妻一区二区三区 | 欧美精品午夜 | 男阳茎进女阳道视频大全 | 国产另类ts人妖一区二区 | 美女扒开尿口给男人桶 | 99热6这里只有精品 三级av在线免费观看 | 人人射人人插 | 亚洲精品大全 | 哺乳援交吃奶在线播放 | 在线观看黄网 | 加勒比综合网 | 亚洲咪咪 | 99国产精品久久久久久久成人 | 黑人干亚洲女 | 六月综合 | 久久国内视频 | www.一区二区三区四区 | 韩国一区二区三区视频 | 黄色免费视频观看 | 精品国产91久久久久久 | 超薄肉色丝袜一二三 | 龚玥菲三级露全乳视频 | 在线免费精品视频 | www.777奇米| 久草欧美视频 | 一区二区视频免费在线观看 | 先锋影音制服丝袜 | 在线视频污 | 久久国产精品-国产精品 | 欧美精品 日韩 | 亚洲精品h |