python知识点智能问答_基于知识图谱的智能问答机器人
研究背景及意義
智能問答是計算機(jī)與人類以自然語言的形式進(jìn)行交流的一種方式,是人工智能研究的一個分支。
知識圖譜本質(zhì)上是一種語義網(wǎng)絡(luò),其結(jié)點代表實體(entity)或者概念(concept),邊代表實體/概念之間的各種語義關(guān)系。知識圖譜的出現(xiàn)是信息技術(shù)發(fā)展、時代發(fā)展的必然結(jié)果。語義的本質(zhì)是關(guān)聯(lián)。只有基于語義的數(shù)據(jù)互聯(lián)才能發(fā)揮數(shù)據(jù)集成的非線性效應(yīng),才能獲取大數(shù)據(jù)的特有語義。
近年來,基于知識圖譜的問答系統(tǒng)則成為學(xué)術(shù)界和工業(yè)界的研究和應(yīng)用熱點方向。相較于純文本,知識圖譜在問答系統(tǒng)中具有以下優(yōu)勢。這些優(yōu)勢都促使本文使用知識圖譜來作為問答系統(tǒng)的知識來源。
-數(shù)據(jù)關(guān)聯(lián)度:語義理解智能化程度問題語義理解程度是問答系統(tǒng)的核心指標(biāo)。在知識圖譜中,所有知識點被具有語義信息的邊所關(guān)聯(lián)。從問句到知識圖譜的知識點的匹配關(guān)聯(lián)過程中,可以用到大量其關(guān)聯(lián)結(jié)點的關(guān)聯(lián)信息。這種關(guān)聯(lián)信息無疑更為智能化的語義理解提供了條件。
-數(shù)據(jù)精度:回答準(zhǔn)確率知識圖譜的知識來自專業(yè)人士標(biāo)注,或者專業(yè)數(shù)據(jù)庫的格式化抓取,這保證了數(shù)據(jù)的高準(zhǔn)確率。
-數(shù)據(jù)結(jié)構(gòu)化:檢索效率知識圖譜的結(jié)構(gòu)化組織形式,為計算機(jī)的快速知識檢索提供了格式支持。
本系統(tǒng)實現(xiàn)目標(biāo)和內(nèi)容
本文針對實驗室這一關(guān)系領(lǐng)域構(gòu)建知識圖譜,基于Neo4j(非關(guān)系型數(shù)據(jù)庫)建立學(xué)生、老師、項目三個實體的關(guān)系網(wǎng)絡(luò),使用Python AIML搭建智能問答機(jī)器人開發(fā)環(huán)境,將二者集成,通過接入微信可視化。
最終實現(xiàn)的主要功能是:通過微信向個人(或公眾號)賬號發(fā)送人物、關(guān)系查詢信息,機(jī)器人能夠自動查詢后回答。
系統(tǒng)設(shè)計框圖
知識圖譜設(shè)計
Neo4j 是一個無框架數(shù)據(jù)庫,它將數(shù)據(jù)作為頂點和邊存儲,適合知識圖譜的存儲結(jié)構(gòu)。它存儲和使用的數(shù)據(jù)自始至終都是使用原生的圖結(jié)構(gòu)數(shù)據(jù)進(jìn)行處理的,不像有些圖數(shù)據(jù)庫,只是在計算處理時使用了圖結(jié)構(gòu)數(shù)據(jù),而在存儲時還將數(shù)據(jù)保存在關(guān)系型數(shù)據(jù)庫中。并且它性能高;存儲讀寫速度快;穩(wěn)定性好;作為較早的一批圖形數(shù)據(jù)庫之一,文檔和各種技術(shù)博客較多。
Neo4j 的查詢語言 Cypher 是一種對圖形聲明查詢的語言,使用圖形模式匹配作為主要的機(jī)制來處理圖形數(shù)據(jù)選擇。Neo4j 提供Python的基本操作API 接口,方便融合到整個系統(tǒng)當(dāng)中。
抽取的實體:學(xué)生、老師、項目
學(xué)生與老師之間存在“師生”關(guān)系;學(xué)生與項目存在“負(fù)責(zé)人”、“成員”等關(guān)系;老師與項目存在“負(fù)責(zé)人”、“成員”等關(guān)系。
知識存儲結(jié)構(gòu)
智能問答機(jī)器人
利用Python AIML 人工智能標(biāo)記語言建立機(jī)器人問答語料庫。
語料庫建立
微信接入可視化
微信團(tuán)隊給開發(fā)者提供了一套標(biāo)準(zhǔn)的接口,為開發(fā)者的開發(fā)工作提供了很大的便利,我們只需要學(xué)習(xí)如何通過開放接口獲取用戶查詢的消息,以及如何發(fā)送給用戶消息這兩個部分。本系統(tǒng)正是利用微信公眾平臺開發(fā)的這些優(yōu)勢,只專注于智能問答系統(tǒng)的實現(xiàn)過程,大大減少了網(wǎng)絡(luò)通信和交互界面設(shè)計的工作量,因此選擇它作為問答這一互動過程的交流渠道。
微信開發(fā)機(jī)制
實現(xiàn)效果圖
后記
由于數(shù)據(jù)可達(dá)性,選擇的是實驗室的知識圖譜,還可以擴(kuò)展到任一領(lǐng)域,第一次寫作,做得不好希望大家提出意見,源碼見個人github
博客地址:https://veronica1997.github.io/
總結(jié)
以上是生活随笔為你收集整理的python知识点智能问答_基于知识图谱的智能问答机器人的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python开发的系统有哪些_Pytho
- 下一篇: python3开发工具推荐_python