1-通用对话系统-阿里大文娱-李亚楠
整理自2019AI科學(xué)前沿大會(huì)分會(huì)場(chǎng)2-自然語(yǔ)言處理,如有侵權(quán),請(qǐng)聯(lián)系作者刪除。
圖片下載鏈接: https://pan.baidu.com/s/1M_n9OX3H6U7AujsYFIpHOw 提取碼: iz2x?
1-通用對(duì)話系統(tǒng)-阿里大文娛-李亞楠
對(duì)于對(duì)話系統(tǒng)的理解,我們想象中是像經(jīng)常在電影里看到的比如賈維斯等的,但是回歸到現(xiàn)實(shí)世界中,有時(shí)候會(huì)覺(jué)得對(duì)話系統(tǒng)有些智障。本次的分享主要以技術(shù)報(bào)告的形式,我們先看看對(duì)話系統(tǒng)的發(fā)展過(guò)程,上個(gè)世紀(jì)60年代,出現(xiàn)了Elisa(對(duì)話機(jī)器人),甚至后來(lái)用于心理咨詢師等等。我們從工業(yè)界、搜索引擎的角度出發(fā)來(lái)看,第一代互聯(lián)網(wǎng)的出現(xiàn)時(shí)因?yàn)樾畔⒘吭龆?#xff0c;楊致遠(yuǎn)和他的舍友通過(guò)手動(dòng)編輯的方式,也就是當(dāng)時(shí)的Yahoo,后來(lái)有發(fā)展到了Google網(wǎng)頁(yè)搜索階段,再后來(lái)web搜索。
大致經(jīng)歷了中國(guó)雅虎搜索、阿里云搜索、神馬搜索、UC頭條、夸克。
也就是說(shuō),我們需要一個(gè)跨平臺(tái)多終端的智能助手,主要分為三個(gè)方面:業(yè)務(wù)產(chǎn)品:UC瀏覽器、UC頭條等;技術(shù)設(shè)施:搜索、推薦、智能交互;內(nèi)容生態(tài):阿里的大魚(yú)號(hào)、知識(shí)圖譜、用戶畫(huà)像、非結(jié)構(gòu)化的網(wǎng)頁(yè)生態(tài)等等。
通用對(duì)話平臺(tái)的結(jié)構(gòu)框架如下:核心是對(duì)話系統(tǒng)SDS
對(duì)話系統(tǒng)中的五個(gè)組成部分:自動(dòng)語(yǔ)音識(shí)別(ASR),自然語(yǔ)言理解(NLU),對(duì)話管理(DM),自然語(yǔ)言生成(NLG)和文本到語(yǔ)音合成(TTS)。
?
遷移學(xué)習(xí)主要有半監(jiān)督和監(jiān)督兩種方式。數(shù)據(jù)量大,會(huì)采用小樣本學(xué)習(xí)的方法。
對(duì)話管理(DM)的目的是在有著不同知識(shí)的不同領(lǐng)域中通過(guò)使用NLP的方法進(jìn)行流暢地表達(dá),涉及到眾多領(lǐng)域,同時(shí)聊天也有很多技術(shù),如聊天術(shù)等等的,如何將他們統(tǒng)一起來(lái),進(jìn)行靈活地處理,是一個(gè)難點(diǎn),同時(shí)也需要注意到它的可擴(kuò)展性,不能說(shuō)稍有變動(dòng)就重頭來(lái)過(guò),因此提出了這個(gè)業(yè)務(wù)與引擎分離的思想,業(yè)務(wù)就是上層的一些機(jī)構(gòu)和分支,DST層就是引擎層。
?
?
?
?
?
除了檢索式對(duì)話系統(tǒng),還有生成式的對(duì)話系統(tǒng),生成式的對(duì)話系統(tǒng)的概念,是當(dāng)前的一個(gè)學(xué)術(shù)熱點(diǎn),但是目前應(yīng)用不成書(shū),準(zhǔn)確率低。
?
目前對(duì)話系統(tǒng)在古詩(shī)生成、對(duì)聯(lián)生成等方面做的較好,但是在簡(jiǎn)單的日常對(duì)話上表現(xiàn)欠佳。
?
Q:對(duì)知識(shí)圖譜的查詢是否會(huì)消耗大量的時(shí)間,知識(shí)圖譜的存儲(chǔ)。
答:知識(shí)圖譜的建立經(jīng)過(guò)很長(zhǎng)時(shí)間,大概三四年,需要一個(gè)慢慢積累的過(guò)程,尤其是長(zhǎng)尾數(shù)據(jù)。知識(shí)圖譜存在于圖數(shù)據(jù)庫(kù)中,對(duì)它做關(guān)系抽取、驗(yàn)證,時(shí)間是挑戰(zhàn)之一,如果規(guī)模大,那么相應(yīng)的靈活性相應(yīng)地較小,目前只用于處理一些比較簡(jiǎn)單的問(wèn)題,如一輪推理。
總結(jié)
以上是生活随笔為你收集整理的1-通用对话系统-阿里大文娱-李亚楠的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 当p.1引脚的电平正跳变c语言程序,数字
- 下一篇: Python和Raspberry Pi物