日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

【NLP-ChatBot】我们熟悉的聊天机器人都有哪几类?

發布時間:2025/3/20 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【NLP-ChatBot】我们熟悉的聊天机器人都有哪几类? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本篇是專欄中介紹聊天機器人的第一篇,會大概介紹聊天機器人的歷史、特點、分類以及技術框架,讓大家對聊天機器人有一個大致的了解。

作者&編輯 | 小Dream哥

1 chatbot概述

關于對話機器人的研究,可以追溯到上個世紀50年代,Alan M. Turing提出了“機器可以思考嗎?”的圖靈測試問題來衡量人工智能發展的程度。圖靈測試簡單來說,就是讓測試者分別與機器人和人進行對話,看測試者能否將機器人辨別出來。該領域接下來就變成了人工智能領域中一個十分有趣又具有挑戰性的研究問題:如何設計及開發智能聊天機器人。

從應用上來說,智能聊天機器人實際上是為了應對信息爆炸的今天存在的信息過載問題。早期,人們是把智能聊天機器人當作搜索引擎的終極形態來進行設計和開發的。具體來說,其需要解決的問題是,人們對于簡單的搜索引擎僅僅返回一個網頁集合的不是特別滿意。通常,現有的搜索引擎需要逐個瀏覽和仔細閱讀搜索引擎返回的每個鏈接網址中的信息,再剔除冗余信息后才能得到期望的答案。

更好的用戶體驗是,用戶在向智能對話系統用自然語言提出一個問題之后,且智能對話系統也能夠自然又通順地回答問題,且回答內容與問題緊湊相關又答案精準,為用戶節約了更多的時間。

到目前為止,智能聊天機器人在產業界已經有了一些初步成功的應用,在智能客服、個人助理等場景中,在電商、保險等行業中已經能夠替代大量的人工客服,進行簡單的業務處理和客戶支持。

基于聊天機器人的應用場景,聊天機器人主要分為3種類型,即問答系統(QA),對話系統,閑聊機器人,下面大致介紹三種類型的聊天機器人的特點。

2 問答系統(QA)

問答系統是基于用戶的問題,給定一個回答,不涉及到多輪對話。通常用于智能搜索,智能家居中的家電控制等場景。問答系統往往不需要調用業務能力,只需要完成對用戶問題的匹配及回答。

下面介紹下問答系統中最常用的技術方案,如下圖所示:

抽象的看,問答系統的任務其實就是,對用戶的輸入進行相似度或者相關性計算,然后在相應的FAQ的庫里,尋找該用戶輸入對應的答案,并返回給用戶。

所以,通常來講,QA系統一般是針對某一個領域的,通常用于某一個領域的客戶支持和服務。

那么,要構建一個QA系統,第一步就是要構建一個高質量的FAQ語料集。語料集中應包含大量高質量的問題-答案(Q-A)對。

模型的訓練過程,就是讓模型能夠學習到問題-答案(Q-A)對之間的聯系,或者Query集的特征。所以,目前QA系統的實現,只要以下三種方式:

1.計算用戶輸入Query和Question的相似度。通過計算用戶輸入Query與FAQ語料集中Question之間的相似度,選出相似度最高的Question,再通過Q-A map找到相應的答案返回給用戶。

2.計算用戶輸入Query和Answer之間的相關性。通過計算用戶輸入Query與FAQ語料集中Answer之間的相關度,選出相關度最高的Answer,返回給用戶。

3.結合用戶輸入Query和Answer之間的相關性以及用戶輸入Query和Question的相似度。通過結合相關性和相似度,選出最匹配的Answer,返回給用戶。

3 對話系統

對話系統(Dialogue System)通常是面向某一個任務,機器人需要同用戶交互,甚至交互多輪。最后,還需要調用業務資源,以完成某一項任務。例如,查天氣的機器人,根據用戶的輸入,判斷是否能夠查詢到某時某地的天氣,如果條件不足,需要主動向用戶問詢,最后再調用類似“中國天氣網”獲得天氣數據。

對話系統的應用場景很豐富,像客服機器人,銷售機器人等都是對話系統的代表。

如下圖所示,展示了一個對話系統的技術架構圖:

通常,對話系統包含自然語言理解(NLU),對話管理(DM),自然語言生產(NLG)等部分。

NLU部分負責對用戶輸入進行理解,主要包括意圖識別和實體識別;DM部分是對整個用戶的對話狀態進行管理,包括槽位管理,行為決策,數據獲取等功能;NLG主要負責答案的生成。

4 閑聊式機器人

閑聊就是一種開放域的聊天場景,就像兩個朋友之間聊天,不限制主題和內容。閑聊式的機器人主要用于私人助理、娛樂等場景,典型的代表如微軟小冰、蘋果Siri等。

閑聊式的機器人,開發難度非常的大,需要巨量的數據集以及能兼顧靈活度和準確度的算法模型。目前,閑聊式的機器人效果都差強人意,個人認為后續需要結合優質的知識圖譜網絡以及強大的增強學習算法。

這里介紹一種比較流行的生成式的閑聊機器人的技術架構,讓大家熟悉下閑聊式機器人最基礎的實現方式。

如上圖所示,生成式的閑聊機器人通常基于seq2seq架構,利用模型自動生成答案,結合Attention等技術進行優化。目前,為了實現對用戶輸入更好的編碼,會引入Attention等技術;為了實現模型對用戶前后文輸入的理解能力,會引入用戶歷史記錄的編碼等。這種方式完全基于數據,優點是比較靈活,不需要做復雜的對話管理;缺點是可控性不強,生成的答案往往比較短,很多無意義的答案返回,需要大量的訓練數據。

總結

聊天機器人是目前NLP領域非常重要的一個應用場景,綜合了各種NLP技術,非常具有挑戰性。后面我們會深入各個類型機器人,做較為詳細的介紹,敬請關注。

我們會在知識星球討論代碼的具體實現和優化,感興趣掃描下面的二維碼了解。

讀者們可以留言,或者加入我們的NLP群進行討論。感興趣的同學可以微信搜索jen104,備注"加入有三AI NLP群"

下期預告:聊天機器人-QA介紹

知識星球推薦

掃描上面的二維碼,就可以加入我們的星球,助你成長為一名合格的自然語言處理算法工程師。

知識星球主要有以下內容:

(1) 聊天機器人。考慮到聊天機器人是一個非常復雜的NLP應用場景,幾乎涵蓋了所有的NLP任務及應用。所以小Dream哥計劃以聊天機器人作為切入點,通過介紹聊天機器人的原理和實踐,逐步系統的更新到大部分NLP的知識,會包括語義匹配,文本分類,意圖識別,語義匹配命名實體識別、對話管理以及分詞等。

(2) 知識圖譜。知識圖譜對于NLP各項任務效果好壞的重要性,就好比基礎知識對于一個學生成績好壞的重要性。他是NLP最重要的基礎設施,目前各大公司都在著力打造知識圖譜,作為一個NLP工程師,必須要熟悉和了解他。

(3) NLP預訓練模型。基于海量數據,進行超大規模網絡的無監督預訓練。具體的任務再通過少量的樣本進行Fine-Tune。這樣模式是目前NLP領域最火熱的模式,很有可能引領NLP進入一個全新發展高度。你怎么不深入的了解?

轉載文章請后臺聯系

侵權必究

往期精選

與50位技術專家面對面20年技術見證,附贈技術全景圖

總結

以上是生活随笔為你收集整理的【NLP-ChatBot】我们熟悉的聊天机器人都有哪几类?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。