Mozilla “Common Voice” 开源语音识别项目
語音識(shí)別技術(shù)可能會(huì)徹底改變我們與機(jī)器的交互方式,但通常技術(shù)開發(fā)代價(jià)昂貴,而且有專利上的使用限制。大多數(shù)語音識(shí)別技術(shù)都被封鎖在少數(shù)的大公司內(nèi)。Mozilla認(rèn)為這樣會(huì)阻礙創(chuàng)新,因此它發(fā)起了“Common Voice”這一開源語音識(shí)別項(xiàng)目。
\\在“Common Voice”項(xiàng)目中,你可以捐獻(xiàn)語音到一個(gè)大型數(shù)據(jù)庫里,這些語音會(huì)被用于構(gòu)建開源的語音識(shí)別引擎,任何人都可以訪問這些數(shù)據(jù)從而輕松又快速地訓(xùn)練基于語音的應(yīng)用程序。通過“Common Voice”,程序員們可以開發(fā)很多有趣的應(yīng)用程序,如實(shí)時(shí)語音翻譯、基于語音的管理助手等等。用戶也可以幫助驗(yàn)證語音,根據(jù)顯示的文本判斷聽到的語音是否正確,該判斷結(jié)果也會(huì)被用于改進(jìn)語音識(shí)別模型。
\\Mozilla計(jì)劃從2017年六月份開始收集總時(shí)長約10,000個(gè)小時(shí)的語音(這是訓(xùn)練一個(gè)語音文本轉(zhuǎn)換系統(tǒng)所需要的數(shù)據(jù)量),之后會(huì)開源語音數(shù)據(jù)庫。目前的源文本來自人們的捐獻(xiàn),以及一些公開的電影劇本,如電影“風(fēng)云人物”(It's a Wonderful Life)。考慮到實(shí)際生活中人們的語音變化多樣,Mozilla希望能收集到多樣化的語音,讓語音識(shí)別引擎能夠準(zhǔn)確無誤地處理不同場景下的語音,比如帶有背景對(duì)話聲、汽車噪音、風(fēng)扇噪音的場景。在將來,Mozilla有可能會(huì)將該語音識(shí)別引擎集成到Firefox中。
\\該項(xiàng)目在Github上的鏈接:https://github.com/mozilla/voice-web
\\查看英文原文:?Project Common Voice
\\感謝蔡芳芳對(duì)本文的審校。
\給InfoQ中文站投稿或者參與內(nèi)容翻譯工作,請(qǐng)郵件至editors@cn.infoq.com。也歡迎大家通過新浪微博(@InfoQ,@丁曉昀),微信(微信號(hào):InfoQChina)關(guān)注我們。
總結(jié)
以上是生活随笔為你收集整理的Mozilla “Common Voice” 开源语音识别项目的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JavaSE之ClassLoader
- 下一篇: 中国大数据争夺战已进入前所未有的高度