深度学习核心技术精讲100篇(二十七)-如何利用NLP技术对ASR的query文本进行预处理纠错?
前言
語音系統(tǒng)中語音內(nèi)容識別 ( ASR ) 的精準(zhǔn)性,是影響智能語音產(chǎn)品發(fā)展的關(guān)鍵制約因素,用戶query的文本,通常是由ASR系統(tǒng)將用戶的語音命令轉(zhuǎn)換而成,但由于技術(shù)上的原因,這些由ASR生成的文本可能包含錯誤,繼而導(dǎo)致后續(xù)的用戶意圖理解出現(xiàn)偏差。如何利用NLP技術(shù)對ASR的query文本進(jìn)行預(yù)處理糾錯成了一個亟待解決的問題。
01 ASR糾錯問題的介紹
1. 語音交互流程
在分享語音糾錯的相關(guān)問題之前,先簡單介紹一下小愛同學(xué)語音使用流程:首先我們需要喚醒小愛同學(xué),比如,手機(jī)按鍵或者語音喚醒,喚醒之后進(jìn)入錄音模塊,啟動錄音前開啟Voice Activity Detection ( VAD ) 狀態(tài),檢測當(dāng)前有沒說話聲音,如果沒有則忽略,如果有,會把語音記錄下來傳遞到下一個模塊,就是最受關(guān)注的Automatic Speech Recognition ( ASR ),該模塊負(fù)責(zé)把語音轉(zhuǎn)譯成文字。
文本理解模塊Natural Language Understanding ( NLU ),主要目的是試圖理解ASR轉(zhuǎn)換出的文本,準(zhǔn)確識別用戶的意圖,然后給出
總結(jié)
以上是生活随笔為你收集整理的深度学习核心技术精讲100篇(二十七)-如何利用NLP技术对ASR的query文本进行预处理纠错?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux从入门到精通系列之SHELL编
- 下一篇: 深度学习核心技术精讲100篇(二十八)-