知识图谱演进
http://blog.csdn.net/yczws1/article/details/16993989
知識圖譜技術的演進
簡述
“圖譜”是指進過系統編輯并根據實物描述或攝制的圖,是研究某一學科所用的資料。“圖譜”中的“圖”指的是地圖,“譜”指系統,圖與譜合一則是空間與時間動態變化的統一表述。圖譜主要表現事物和現象的形態結構、成因機制、組成物質、動態變化等綜合性、復雜性規律,往往以系列圖的形式表示時空動態變化[12]。
知識圖譜,也被稱為科學知識圖譜、知識域可視化或知識域映射地圖,是顯示科學知識的發展進程與結構關系的的一系列各種不同的圖形。它用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。文獻[4]也將科學知識圖譜譯為Scientific?Knowledge?Map,在上述概念的基礎上認為科學知識圖譜可以在組織內創造知識共享的環境,從而最終達到促進知識交流和研究深入的目的。
?
具體來說,知識圖譜是把應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,用可視化的圖譜形象地展示學科?的核心框架、發展歷史、前沿領域以及整體知識架構的多學科融合的一種研究方法。它把復雜的知識領域通過數據挖掘、信息處理、知識計量和圖形繪制而顯示出?來,揭示知識領域的動態發展規律,為學科研究提供切實的、有價值的參考[12]。
?
Google知識圖譜(Knowledge?graph),通過用戶搜索query,能夠顯示關于這個query相關的更多的實時信息。使得搜索智能化,根據用戶的意圖得到用戶想要的結果。
知識圖譜,可將搜索結果進行知識系統化。一個關鍵詞搜索也能獲得多維度的相關信息,呈現在有結構化的知識卡上。為用戶提供有完整知識體系的搜索結果。
相比于之前的搜索結果看來,“知識圖譜”將在三個方面提高Google搜索的最終結果:
找到正確的結果。由于一個關鍵詞可能代表多重含義,所以知識圖譜會將最全面的信息展現出來,讓用戶找到自己最想要的那種含義。
最好的總結。有了知識圖譜,Google?可以更好的理解用戶搜索的信息,并總結處相關的內容和主題。當你搜“瑪麗·居里”時,你不僅可以獲得這個關鍵詞的所有相關內容,還能獲得居里夫人的詳細生平介紹。
更深、更廣。由于“知識圖譜”會給出搜索結果的完整知識體系,所以用戶往往會發現很多不知道的東西(知識)。當你搜索一個即將去玩的地方時,可能你會發現一個以此命名的餐館,甚至還可能發現還有一本小說就叫這個名字,并且已經改編成了同名電影。
涉及到的方面
??1.復雜的數據模型構建:freebase?的namespace?domain?type?property,其中的相互關聯關系。
????? 2.?數據結構、數據存儲、圖數據存儲
????? 3.?數據收集困難:這種結構化的數據,添加困難,需要的字段比較多。
?? ?? 4.?完整的體系:freebase的體系價值很大,需要內部構建基礎的數據,同時需要定制規則,讓?其他數據源接入,商業合作類型的。需要大量的人工進行審核和規范。
特點
1、能夠利用對自然語言查詢進行深入的理解,并從語義層面解析用戶查詢意圖;
2、能夠利用海量的結構化知識庫,針對用戶查詢提供準確的答案。
????? ? 3、充分利用結構化大數據,深入理解用戶自然語言查詢并針對查詢出準確的答案,能夠更好地給出準確的答案,能夠更好地滿足人類對知識獲取的需求,同時也代表計算和搜索的未來。
背后的支持?
??????? 知識圖譜的背后是龐大的信息庫。知識圖譜的信息搜集工作始于2010年收購的Metaweb。Metaweb專注于將不同文字表述與同一個實體連接起來,并探索這些實體的屬性和彼此之間的關系,最終提供一種新的搜索形式。Metaweb的數據來源主要來源與Freebase?,而google的信息來源較廣。
發展趨勢
?????? 知識圖譜:未來的數據挖掘,基于海量數據之上的數據管理平臺(DMP)。搭建使用即反饋的個性化數據產品平臺。根據用戶的任何需求,追究映射其根源,實時個性化推薦。在需求和產品上精益求精個性化。更加符合用戶的需求。
對比
相比與Goggle提出的knowledge?graph?,Facebook也于2013年1月15日推出了圖譜搜索(Graph?search)。該功能基于社交圖譜(social?graph)的語義搜索服務。目的:讓一切信息可搜索化、可被發現用戶登錄使用臉譜搜索框時,能在下拉菜單中中使用好友、照片、地點和興趣等新的搜索選項。與基于關鍵詞匹配的傳統網絡搜索引擎相比,圖譜搜索能夠支持更自然、復雜的查詢輸入,并針對查詢直接給出答案。與搜索引擎關鍵詞自動補足功能類似,圖譜搜索會在用戶輸入時同步預測用戶搜索意圖,并根據用戶選擇進行查詢擴展。
圖譜搜索是基于社交圖譜構建起來的搜索服務,與基于關鍵詞匹配的傳統網絡搜索引擎相比,圖譜搜索能夠支持更自然、復雜的查詢輸入,并針對查詢直接給出答案。
除臉譜外,信息技術領域的其他巨頭也先后推出了類似的基于結構化數據的搜索產品或服務,作為其進軍和探索下一代搜索引擎技術的橋頭堡和試驗田。
谷歌提出了知識圖譜[9]?的概念,并推出了基于知識圖譜的新型搜索服務。知識圖譜從本質上講是一個知識庫,基于知識圖譜的搜索服務則可以看作是一個典型的自動問答系統。與傳統網頁搜索相比,基于知識圖譜的搜索能夠更好地理解用戶的搜索意圖,并對相關內容和主題進行總結。例如,當輸入“Bill?Gates”時,用戶不僅可以獲得這個關鍵詞的全部信息,還能獲取關于Bill?Gates?的介紹。知識圖譜還能夠提供搜索結果的詳細知識體系,幫助用戶從更多角度了解搜索結果的相關信息。
有趣的事情[13]
在關于臉譜搜索的演進中,必不可少的兩個人是:扎克伯格、拉斯穆森。前者不用多說,后者是Google?Maps的締造者,不用多說,想想有多牛逼。拉斯穆森加入Facebook搜索團隊后,開始這個劃時代的的產品。他提到:讓這一搜索引擎幾乎能回答任何問題。給出的結果是:絕不可能,隨便輸入想要的東西然后就能變魔術一樣彈出一個包含相關內容的頁面,這種事情不是通過自然語言所能實現的,更別說為所有這些內容編制索引了。在?Facebook?上有超過?1?萬億個用戶關系,將這些關系索引化,還要隨意利用它們,這絕對是一個巨大的技術挑戰!但如果能實現,這將是非常棒的一個產品。With?Google's?words:?you?must?implement?it!??Facebook?就像一個巨大的數據庫,而你在其中查找匹配的搜索結果,而搜索結果本身也是根據搜索目的進行量身定制的。
?
相比于Google和Facebook,Microsoft同時也在做出努力。通過提取網頁中的非結構化數據,構建了結構化的知識庫Satori[11],用于從語義層面提高和改進必應的搜索質量。此外,與谷歌的知識圖譜搜索類似,當用戶輸入的查詢語句能夠被后臺自然語言處理模塊解析時,必應將觸發自動問答模塊,基于Satori?知識庫生成答案,并將生成的結果及其相關知識直接返回給用戶。
愿景
讓我們追到遠古的需求,展現盡美。
Vision:?Let?all?the?information?searchable,can?be?found.
?
?
?
參考內容:
[1]http://www.36kr.com/p/109843.html
[2]http://www.36kr.com/p/202209.html
[3]http://blog.sina.com.cn/s/blog_7d26e1ac01015itb.html
[4]http://blog.sina.com.cn/s/blog_4caedc7a0102e
[5]http://searchengineland.com/google-launches-knowledge-graph-121585vz6.html
[6]http://blog.sina.com.cn/s/blog_4caedc7a0102evz6.html
[7]http://www.zhihu.com/question/21371605
[8]http://news.cnet.com/8300-5_3-0.html?keyword=knowledge+graph
[9]?http://searchengineland.com/google-launches-knowledge-graph-121585
http://www.google.com/insidesearch/features/search/knowledge.html
[11]?Gallagher,?Sean.?How?Google?and?Microsoft?taught?searchto?understand?the?Web.?2012
[12]http://blog.sina.com.cn/s/blog_7d26e1ac01015itb.html
[13]http://www.guokr.com/article/436673/
總結
- 上一篇: Striving For Simplic
- 下一篇: 如何培养人际交往的能力