日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

知识图谱是什么?

發布時間:2024/2/28 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 知识图谱是什么? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

知識圖譜最開始是Google為了優化搜索引擎提出來的,推出之后引起了業界轟動,隨后其他搜索公司也紛紛推出了他們的知識圖譜。知識圖譜發展到今天,不僅是應用在搜索行業,已經是AI的基礎功能了。那到底知識圖譜是什么?有什么能力?怎么應用?這就是本文想要討論的內容。

1. 定義

官方定義:知識圖譜是一種基于圖的數據結構,由節點(point)和邊(Edge)組成,每個節點表示一個“實體”,每條邊為實體與實體之間的“關系”,知識圖譜本質上是語義網絡。

實體指的可以是現實世界中的事物,比如人、地名、公司、電話、動物等;關系則用來表達不同實體之間的某種聯系。

由上圖,可以看到實體有地名和人;大理屬于云南、小明住在大理、小明和小秦是朋友,這些都是實體與實體之間的關系。

通俗定義:知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網絡,因此知識圖譜提供了從“關系”的角度去分析問題的能力。

2. 可視化表現

如果我們在百度搜索“周杰倫的老婆”的時候,搜索結果不是周杰倫,而是直接返回了昆凌的信息卡片,為什么呢?

因為底層知識圖譜已經有了周杰倫和昆凌是夫妻關系,所以可以理解到你要找的是昆凌,而不是周杰倫,這也說明了知識圖譜有理解用戶意圖的能力。

02 知識圖譜構建的關鍵技術

知識圖譜構建的過程中,最主要的一個步驟就是把數據從不同的數據源中抽取出來,然后按一定的規則加入到知識圖譜中,這個過程我們稱為知識抽取

數據源的分為兩種:結構化的數據和非結構化的數據。

結構化的數據是比較好處理的,難點在于處理非結構化的數據。而處理非結構化數據通常需要使用自然語言處理技術:實體命名識別、關系抽取、實體統一、指代消解等。

我們先來看下把這段文字變成知識圖譜的方式表達的結果:

上圖左邊的文案就是一個非結構化的文本數據,就需要經過一系列的技術處理,才能轉化為右邊的知識圖譜。具體是怎么實現的呢,接下來一一討論。

1. 實體命名識別

提取文本中的實體,并對每個實體進行分類或打標簽,比如把文中“1984年12月30日”記為“時間”類型;“克利夫蘭騎士”和“邁阿密熱火”記為“球隊”類型,這個過程就是實體命名。

2. 關系抽取

關系抽取是把實體之間的關系抽取出來的一項技術,其中主要是根據文本中的一些關鍵詞,如“出生”、“在”、“轉會”等,我們就可以判斷詹姆斯與地點俄亥俄州、與邁阿密熱火等實體之間的關系。

3. 實體統一

在文本中可能同一個實體會有不同的寫法,比如說“LBJ”就是詹姆斯的縮寫,因此“勒布朗詹姆斯”和“LBJ”指的就是同一個實體,實體統一就是處理這樣問題的一項技術。

4. 指代消解

指代消解跟實體統一類似,都是處理同一個實體的問題。比如說文本中的“他”其實指的就是“勒布朗詹姆斯”。所以指代消解要做的事情就是,找出這些代詞,都指的是哪個實體。

指代消解和實體統一是知識抽取中比較難的環節。

03 知識圖譜的存儲

知識圖譜主要有兩種存儲方式:一種是基于RDF的存儲;另一種是基于圖數據庫的存儲。

1. RDF

RDF一個重要的設計原則是數據的易發布以及共享,另外,RDF以三元組的方式來存儲數據而且不包含屬性信息。

2. 圖數據庫

圖數據庫主要把重點放在了高效的圖查詢和搜索上,一般以屬性圖為基本的表示形式,所以實體和關系可以包含屬性。

3. RDF和圖數據庫的主要特點區別

關于知識圖片的存儲方式的內容比較專業,且沒有實際操作過比較難理解,所以我就不在此展開討論了,大家簡單知道知識圖譜有這么一項內容就行,若有需要的可以自行研究下。

下面我們把重點放在知識圖片在金融領域的一些應用。

04 知識圖譜在金融領域的應用

知識圖譜在各行各業中的應用是比較普及的,并且有很重要的地位。下面我們跟大家一起討論的是知識圖譜在金融領域的一些應用,希望能通過這些例子給大家一點啟發。

1. 反欺詐

假設銀行要借錢給一個人,那要怎么判斷這個人是真實用戶還是欺詐的呢?

我們需要以人為核心,展開一系列的數據構建,比如說用戶的基本信息、借款記錄、工作信息、消費記錄、行為記錄、網站瀏覽記錄等等。把這些信息整合到知識圖譜中。從而整體進行預測和評分,用戶欺詐行為的概率有多大。當然這個預測是需要通過機器學習,得到一個合理的模型,模型中可能會包括消費記錄的權重、網站瀏覽記錄的權重等等信息。

2. 不一致性驗證

比如說不同的兩個借款人,卻填寫了同一個電話號碼,那說明這兩個人中至少有一個是可疑的了,這時就需要重點關注了。

更復雜點的,可能需要知識圖譜通過一些關系去推理了。比如說“借款人”跟小明和小秦都是母子關系,按推理的話小明跟小秦應該是兄弟關系,而在知識圖譜上顯示的是朋友關系,就有可能有異常了,因此也需要重點關注。

3. 客戶失聯管理

如果借款人失聯了,通過知識圖譜,是不是可以聯系他的朋友,或兄弟,甚至是兄弟的妻子,去追蹤失聯人。

因此在失聯的情況下,知識圖譜可以挖掘更多失聯人的聯系人,從而提高催收效率。

4. 知識推理

如上左圖(注意這里的箭頭方向),小秦是大秦的兒子,大秦是老秦的兒子,從這這樣的關系,我們就可以推理出,小秦是老秦的孫子,這樣就能使知識圖譜更加完善了。

如上左圖,小明在騰訊上班,小秦也在騰訊上班,從這樣的關系,我們可以推理出,小明和小秦是同事關系。

推理能力其實就是機器模仿人的一種重要的能力,可以從已有的知識中發現一些隱藏的知識。當然這樣的能力離不開深度學習,而隨著深度學習的不斷成熟,我相信知識圖譜的能力也會越來越強大。

在此就介紹完了知識圖譜的一些簡單知識,在寫這篇文章的同時,也參考了很多業界優秀大佬的文章,感謝各位大佬的無私分享。

1. 定義

官方定義:知識圖譜是一種基于圖的數據結構,由節點(point)和邊(Edge)組成,每個節點表示一個“實體”,每條邊為實體與實體之間的“關系”,知識圖譜本質上是語義網絡。

實體指的可以是現實世界中的事物,比如人、地名、公司、電話、動物等;關系則用來表達不同實體之間的某種聯系。

由上圖,可以看到實體有地名和人;大理屬于云南、小明住在大理、小明和小秦是朋友,這些都是實體與實體之間的關系。

通俗定義:知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網絡,因此知識圖譜提供了從“關系”的角度去分析問題的能力。

2. 可視化表現

如果我們在百度搜索“周杰倫的老婆”的時候,搜索結果不是周杰倫,而是直接返回了昆凌的信息卡片,為什么呢?

因為底層知識圖譜已經有了周杰倫和昆凌是夫妻關系,所以可以理解到你要找的是昆凌,而不是周杰倫,這也說明了知識圖譜有理解用戶意圖的能力。

02 知識圖譜構建的關鍵技術

知識圖譜構建的過程中,最主要的一個步驟就是把數據從不同的數據源中抽取出來,然后按一定的規則加入到知識圖譜中,這個過程我們稱為知識抽取

數據源的分為兩種:結構化的數據和非結構化的數據。

結構化的數據是比較好處理的,難點在于處理非結構化的數據。而處理非結構化數據通常需要使用自然語言處理技術:實體命名識別、關系抽取、實體統一、指代消解等。

我們先來看下把這段文字變成知識圖譜的方式表達的結果:

上圖左邊的文案就是一個非結構化的文本數據,就需要經過一系列的技術處理,才能轉化為右邊的知識圖譜。具體是怎么實現的呢,接下來一一討論。

1. 實體命名識別

提取文本中的實體,并對每個實體進行分類或打標簽,比如把文中“1984年12月30日”記為“時間”類型;“克利夫蘭騎士”和“邁阿密熱火”記為“球隊”類型,這個過程就是實體命名。

2. 關系抽取

關系抽取是把實體之間的關系抽取出來的一項技術,其中主要是根據文本中的一些關鍵詞,如“出生”、“在”、“轉會”等,我們就可以判斷詹姆斯與地點俄亥俄州、與邁阿密熱火等實體之間的關系。

3. 實體統一

在文本中可能同一個實體會有不同的寫法,比如說“LBJ”就是詹姆斯的縮寫,因此“勒布朗詹姆斯”和“LBJ”指的就是同一個實體,實體統一就是處理這樣問題的一項技術。

4. 指代消解

指代消解跟實體統一類似,都是處理同一個實體的問題。比如說文本中的“他”其實指的就是“勒布朗詹姆斯”。所以指代消解要做的事情就是,找出這些代詞,都指的是哪個實體。

指代消解和實體統一是知識抽取中比較難的環節。

03 知識圖譜的存儲

知識圖譜主要有兩種存儲方式:一種是基于RDF的存儲;另一種是基于圖數據庫的存儲。

1. RDF

RDF一個重要的設計原則是數據的易發布以及共享,另外,RDF以三元組的方式來存儲數據而且不包含屬性信息。

2. 圖數據庫

圖數據庫主要把重點放在了高效的圖查詢和搜索上,一般以屬性圖為基本的表示形式,所以實體和關系可以包含屬性。

3. RDF和圖數據庫的主要特點區別

關于知識圖片的存儲方式的內容比較專業,且沒有實際操作過比較難理解,所以我就不在此展開討論了,大家簡單知道知識圖譜有這么一項內容就行,若有需要的可以自行研究下。

下面我們把重點放在知識圖片在金融領域的一些應用。

04 知識圖譜在金融領域的應用

知識圖譜在各行各業中的應用是比較普及的,并且有很重要的地位。下面我們跟大家一起討論的是知識圖譜在金融領域的一些應用,希望能通過這些例子給大家一點啟發。

1. 反欺詐

假設銀行要借錢給一個人,那要怎么判斷這個人是真實用戶還是欺詐的呢?

我們需要以人為核心,展開一系列的數據構建,比如說用戶的基本信息、借款記錄、工作信息、消費記錄、行為記錄、網站瀏覽記錄等等。把這些信息整合到知識圖譜中。從而整體進行預測和評分,用戶欺詐行為的概率有多大。當然這個預測是需要通過機器學習,得到一個合理的模型,模型中可能會包括消費記錄的權重、網站瀏覽記錄的權重等等信息。

2. 不一致性驗證

比如說不同的兩個借款人,卻填寫了同一個電話號碼,那說明這兩個人中至少有一個是可疑的了,這時就需要重點關注了。

更復雜點的,可能需要知識圖譜通過一些關系去推理了。比如說“借款人”跟小明和小秦都是母子關系,按推理的話小明跟小秦應該是兄弟關系,而在知識圖譜上顯示的是朋友關系,就有可能有異常了,因此也需要重點關注。

3. 客戶失聯管理

如果借款人失聯了,通過知識圖譜,是不是可以聯系他的朋友,或兄弟,甚至是兄弟的妻子,去追蹤失聯人。

因此在失聯的情況下,知識圖譜可以挖掘更多失聯人的聯系人,從而提高催收效率。

4. 知識推理

如上左圖(注意這里的箭頭方向),小秦是大秦的兒子,大秦是老秦的兒子,從這這樣的關系,我們就可以推理出,小秦是老秦的孫子,這樣就能使知識圖譜更加完善了。

如上左圖,小明在騰訊上班,小秦也在騰訊上班,從這樣的關系,我們可以推理出,小明和小秦是同事關系。

推理能力其實就是機器模仿人的一種重要的能力,可以從已有的知識中發現一些隱藏的知識。當然這樣的能力離不開深度學習,而隨著深度學習的不斷成熟,我相信知識圖譜的能力也會越來越強大。

在此就介紹完了知識圖譜的一些簡單知識,在寫這篇文章的同時,也參考了很多業界優秀大佬的文章,感謝各位大佬的無私分享。

總結

以上是生活随笔為你收集整理的知识图谱是什么?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 91尤物在线 | 黄网址在线观看 | 丝袜美腿一区二区三区 | 亚洲一区二区三区综合 | 国产a黄 | 国产a级片免费看 | 日韩av在线播 | 亚洲一区二区三区三州 | 一亲二脱三插 | 玉足脚交榨精h文 | 四月婷婷 | 老头巨大又粗又长xxxxx | 欧美不卡视频在线观看 | 黄色三级网 | 亚洲av无码精品色午夜 | 欧美无马 | 四虎亚洲精品 | 国产97超碰| 欧美综合自拍亚洲综合图片区 | 99艹| 91超碰国产在线 | 在线观看免费视频黄 | 韩漫动漫免费大全在线观看 | 日日久 | 中文字幕看片 | 日韩91av| 欧美高清性 | 欧美一区二区三区在线观看 | 天天躁日日躁狠狠躁免费麻豆 | 成人丁香婷婷 | 日韩精品久久一区二区 | 乳色吐息免费看 | 乡村性满足hd | 国产在线毛片 | 无码无遮挡又大又爽又黄的视频 | 久草国产视频 | 麻豆视频网站在线观看 | 自拍日韩亚洲一区在线 | 91成人午夜 | 久久精品国产亚洲av麻豆图片 | 91综合色| 色噜噜综合 | 国产精品久久久久久久妇 | xxx日本黄色| 日本aⅴ在线观看 | 国产资源在线免费观看 | 韩日av| 成年黄色网| 国产成人免费电影 | 日韩国产一级 | 欧美视频在线观看 | 久久精品视频16 | www黄色com | 日本黄色片免费 | 男人插女人网站 | 日韩淫视频 | 国产精品婷婷午夜在线观看 | 成人免费高清在线播放 | 日韩欧美中文字幕一区 | 国产午夜福利一区二区 | 久久久久久久久影院 | 欧美激情性做爰免费视频 | 国产一级做a爰片在线看免费 | 日韩电影在线观看中文字幕 | 日日干夜夜拍 | 两根大肉大捧一进一出好爽视频 | www.久久国产 | 男人添女人下部高潮视频 | 极品少妇xxxx精品少妇 | 91精品国产福利在线观看 | 日日夜夜婷婷 | 艳母免费在线观看 | 国产乱淫av麻豆国产免费 | 欧美日韩精品一区二区三区四区 | 亚洲不卡中文字幕无码 | 日本大乳奶做爰 | 精品伦精品一区二区三区视频密桃 | 成年人在线视频免费观看 | 免费国产一区二区三区 | 国产视频精品一区二区三区 | 成人午夜网站 | 亚洲av无码专区首页 | 午夜色综合 | 97性视频 | 国产又黄又粗又猛又爽 | 另类小说色 | 伊人成长网| 极品福利视频 | 欧美人性生活视频 | 射区导航| 一区二区视频在线免费观看 | 日韩一级视频在线观看 | 插插插日日日 | 日本一级大毛片a一 | 久久久精品美女 | 亚洲自拍偷拍一区 | 超碰免费公开在线 | 二区三区免费 | 中文字幕一区二区三三 |