日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一窥谷歌神经机器翻译模型真面貌 其底层框架开源

發(fā)布時間:2024/2/28 编程问答 52 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一窥谷歌神经机器翻译模型真面貌 其底层框架开源 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

去年,谷歌發(fā)布了 Google Neural Machine Translation (GNMT),即谷歌神經(jīng)機(jī)器翻譯,一個 sequence-to-sequence (“seq2seq”) 的模型?,F(xiàn)在,它已經(jīng)用于谷歌翻譯的產(chǎn)品系統(tǒng)。雖然消費(fèi)者感受到的提升并不十分明顯,谷歌宣稱,GNMT 對翻譯質(zhì)量帶來了巨大飛躍。

但谷歌想做的顯然不止于此。其在官方博客表示:“由于外部研究人員無法獲取訓(xùn)練這些模型的框架,GNMT 的影響力受到了束縛。”

如何把該技術(shù)的影響力最大化?答案只有一個——開源。

因而,谷歌于昨晚發(fā)布了 tf-seq2seq —— 基于 TensorFlow 的 seq2seq 框架。谷歌表示,它使開發(fā)者試驗 seq2seq 模型變得更方便,更容易達(dá)到一流的效果。另外,tf-seq2seq 的代碼庫很干凈并且模塊化,保留了全部的測試覆蓋,并把所有功能寫入文件。

該框架支持標(biāo)準(zhǔn) seq2seq 模型的多種配置,比如編碼器/解碼器的深度、注意力機(jī)制(attention mechanism)、RNN 單元類型以及 beam size。這樣的多功能性,能幫助研究人員找到最優(yōu)的超參數(shù),也使它超過了其他框架。詳情請參考谷歌論文《Massive Exploration of Neural Machine Translation Architectures》。

上圖所示,是一個從中文到英文的 seq2seq 翻譯模型。每一個時間步驟,編碼器接收一個漢字以及它的上一個狀態(tài)(黑色箭頭),然后生成輸出矢量(藍(lán)色箭頭)。下一步,解碼器一個詞一個詞地生成英語翻譯。在每一個時間步驟,解碼器接收上一個字詞、上一個狀態(tài)、所有編碼器的加權(quán)輸出和,以生成下一個英語詞匯。雷鋒網(wǎng)提醒,在谷歌的執(zhí)行中,他們使用 wordpieces 來處理生僻字詞。

據(jù)雷鋒網(wǎng)了解,除了機(jī)器翻譯,tf-seq2seq 還能被應(yīng)用到其他 sequence-to-sequence 任務(wù)上;即任何給定輸入順序、需要學(xué)習(xí)輸出順序的任務(wù)。這包括 machine summarization、圖像抓取、語音識別、對話建模。谷歌自承,在設(shè)計該框架時可以說是十分地仔細(xì),才能維持這個層次的廣適性,并提供人性化的教程、預(yù)處理數(shù)據(jù)以及其他的機(jī)器翻譯功能。

谷歌在博客表示:

“我們希望,你會用 tf-seq2seq 來加速(或起步)你的深度學(xué)習(xí)研究。我們歡迎你對 GitHub 資源庫的貢獻(xiàn)。有一系列公開的問題需要你的幫助!”

GitHub 地址:https://github.com/google/seq2seq

GitHub 資源庫:https://google.github.io/seq2seq/nmt/


總結(jié)

以上是生活随笔為你收集整理的一窥谷歌神经机器翻译模型真面貌 其底层框架开源的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。