日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

系统架构设计师与系统分析师历年实体分析与解答下载_医疗知识图谱问答系统探究(一)...

發(fā)布時(shí)間:2024/9/19 66 豆豆
生活随笔 收集整理的這篇文章主要介紹了 系统架构设计师与系统分析师历年实体分析与解答下载_医疗知识图谱问答系统探究(一)... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

這是 阿拉燈神丁Vicky 的第 23 篇文章

1、項(xiàng)目背景

為通過項(xiàng)目實(shí)戰(zhàn)增加對(duì)知識(shí)圖譜的認(rèn)識(shí),幾乎找了所有網(wǎng)上的開源項(xiàng)目及視頻實(shí)戰(zhàn)教程。

果然,功夫不負(fù)有心人,找到了中科院軟件所劉煥勇老師在github上的開源項(xiàng)目,基于知識(shí)圖譜的醫(yī)藥領(lǐng)域問答項(xiàng)目QABasedOnMedicaKnowledgeGraph。

項(xiàng)目地址:https://github.com/liuhuanyong/QASystemOnMedicalKG

用了兩個(gè)晚上搭建了兩套,Mac版與Windows版,哈哈,運(yùn)行成功!!!

從無到有搭建一個(gè)以疾病為中心的一定規(guī)模醫(yī)藥領(lǐng)域知識(shí)圖譜,以該知識(shí)圖譜完成自動(dòng)問答與分析服務(wù)。該項(xiàng)目立足醫(yī)藥領(lǐng)域,以垂直型醫(yī)藥網(wǎng)站為數(shù)據(jù)來源,以疾病為核心,構(gòu)建起一個(gè)包含7類規(guī)模為4.4萬的知識(shí)實(shí)體,11類規(guī)模約30萬實(shí)體關(guān)系的知識(shí)圖譜。 本項(xiàng)目將包括以下兩部分的內(nèi)容:

1、基于垂直網(wǎng)站數(shù)據(jù)的醫(yī)藥知識(shí)圖譜構(gòu)建
2、基于醫(yī)藥知識(shí)圖譜的自動(dòng)問答

2、項(xiàng)目環(huán)境

2.1 windows系統(tǒng)

搭建中間有很多坑,且行且注意。

配置要求:要求配置neo4j數(shù)據(jù)庫及相應(yīng)的python依賴包。neo4j數(shù)據(jù)庫用戶名密碼記住,并修改相應(yīng)文件。

安裝neo4j,neo4j 依賴java jdk 1.8版本以上:

java jdk安裝方法可參考:windows系統(tǒng)下安裝JDK8,下載地址:https://download.oracle.com/otn-pub/java/jdk/8u201-b09/42970487e3af4f5aa5bca3f542482c60/jdk-8u201-windows-x64.exe
安裝neo4j可參考博文:windows安裝neo4j,下載地址:https://go.neo4j.com/download-thanks.html?edition=community&release=3.4.1&flavour=winzip
安裝python可參考:Windows環(huán)境下安裝python2.7

根據(jù)neo4j 安裝時(shí)的端口、賬戶、密碼配置設(shè)置設(shè)置項(xiàng)目配置文件:answer_search.py & build_medicalgraph.py (github下載項(xiàng)目時(shí)根據(jù)個(gè)人需要也可使用git)

數(shù)據(jù)導(dǎo)入:python build_medicalgraph.py,導(dǎo)入的數(shù)據(jù)較多,估計(jì)需要幾個(gè)小時(shí)。

python build_medicalgraph.py導(dǎo)入數(shù)據(jù)之前,需要在該文件main函數(shù)中加入:

build_medicalgraph.py

啟動(dòng)問答:python chat_graph.py

2.2 Mac系統(tǒng)

mac本身自帶python、java jdk環(huán)境,可直接安裝neo4j圖數(shù)據(jù)庫,項(xiàng)目運(yùn)行步驟與windows基本一樣。

問題解答:

安裝過程中如遇問題可聯(lián)系Wechat: dandan-sbb。

2.3 Neo4j數(shù)據(jù)庫展示

2.4 問答系統(tǒng)運(yùn)行效果

3、項(xiàng)目介紹

該項(xiàng)目的數(shù)據(jù)來自垂直類醫(yī)療網(wǎng)站尋醫(yī)問藥,使用爬蟲腳本data_spider.py,以結(jié)構(gòu)化數(shù)據(jù)為主,構(gòu)建了以疾病為中心的醫(yī)療知識(shí)圖譜,實(shí)體規(guī)模4.4萬,實(shí)體關(guān)系規(guī)模30萬。schema的設(shè)計(jì)根據(jù)所采集的結(jié)構(gòu)化數(shù)據(jù)生成,對(duì)網(wǎng)頁的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行xpath解析。

項(xiàng)目的數(shù)據(jù)存儲(chǔ)采用Neo4j圖數(shù)據(jù)庫,問答系統(tǒng)采用了規(guī)則匹配方式完成,數(shù)據(jù)操作采用neo4j聲明的cypher。

項(xiàng)目的不足之處在于疾病的引發(fā)原因、預(yù)防等以大段文字返回,這塊可引入事件抽取,可將原因結(jié)構(gòu)化表示出來。

3.1 項(xiàng)目目錄

.

3.2 知識(shí)圖譜的實(shí)體類型

3.3 知識(shí)圖譜的實(shí)體關(guān)系類型

3.4 知識(shí)圖譜的屬性類型

3.5 問答項(xiàng)目實(shí)現(xiàn)原理

本項(xiàng)目的問答系統(tǒng)完全基于規(guī)則匹配實(shí)現(xiàn),通過關(guān)鍵詞匹配,對(duì)問句進(jìn)行分類,醫(yī)療問題本身屬于封閉域類場(chǎng)景,對(duì)領(lǐng)域問題進(jìn)行窮舉并分類,然后使用cypher的match去匹配查找neo4j,根據(jù)返回?cái)?shù)據(jù)組裝問句回答,最后返回結(jié)果。

問句中的關(guān)鍵詞匹配:

根據(jù)匹配到的關(guān)鍵詞分類問句

問句解析

查找相關(guān)數(shù)據(jù)

根據(jù)返回的數(shù)據(jù)組裝回答

3.6 問答系統(tǒng)支持的問答類型

4、項(xiàng)目總結(jié)

基于規(guī)則的問答系統(tǒng)沒有復(fù)雜的算法,一般采用模板匹配的方式尋找匹配度最高的答案,回答結(jié)果依賴于問句類型、模板語料庫的覆蓋全面性,面對(duì)已知的問題,可以給出合適的答案,對(duì)于模板匹配不到的問題或問句類型,經(jīng)常遇到的有三種回答方式:

1、給出一個(gè)無厘頭的答案;
2、婉轉(zhuǎn)的回答不知道,提示用戶換種方式去問;
3、轉(zhuǎn)移話題,回避問題;

例如,本項(xiàng)目中采用了婉轉(zhuǎn)的方式回答不知道:

基于知識(shí)圖譜的問答系統(tǒng)的主要特征是知識(shí)圖譜,系統(tǒng)依賴一個(gè)或多個(gè)領(lǐng)域的實(shí)體,并基于圖譜進(jìn)行推理或演繹,深度回答用戶的問題,基于知識(shí)圖譜的問答系統(tǒng)更擅長(zhǎng)回答知識(shí)性問題,與基于模板的聊天機(jī)器人有所不同的是它更直接、直觀的給用戶答案。對(duì)于不能回答、或不知道的問題,一般直接返回失敗,而不是轉(zhuǎn)移話題避免尷尬。

整個(gè)問答系統(tǒng)的優(yōu)劣依賴于知識(shí)圖譜中知識(shí)的數(shù)量與質(zhì)量。也算是利弊共存吧!知識(shí)圖譜圖譜具有良好的可擴(kuò)展性,擴(kuò)展了知識(shí)圖譜也就是擴(kuò)展了問答系統(tǒng)的知識(shí)庫。如果問句在射程范圍內(nèi),可輕松回答,但如果不幸脫靶,則體驗(yàn)大打折扣。

從知識(shí)圖譜的角度分析,大多數(shù)知識(shí)圖譜規(guī)模不足,主要原因還是數(shù)據(jù)來源以及技術(shù)上知識(shí)的抽取與推理困難。

http://weixin.qq.com/r/qS_uto-EP9JArcvV93q7 (二維碼自動(dòng)識(shí)別)

個(gè)人博客:http://www.bobinsun.cn

題圖

總結(jié)

以上是生活随笔為你收集整理的系统架构设计师与系统分析师历年实体分析与解答下载_医疗知识图谱问答系统探究(一)...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。