白雪 | NLP加持知识图谱在金融事件挖掘中的应用
本文轉載自公眾號:阡尋科技。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
9月15日訊,涵蓋金融科技、人工智能及區塊鏈領域的2018恒生技術開放日于今日開幕,阡尋科技聯席CEO、復旦大學人工智能方向博士白雪受邀出席本次大會,分享了金融領域事件特點分析、常用的事件抽取方法以及金融知識圖譜加持NLP等方面的實踐與心得。與參會人員共同探討了自然語言與知識圖譜未來的發展方向,并對人工智能技術在金融領域的應用進行了展望。
資本運作,并購、高管動向等事件會對金融產品價格產生沖擊,這些事件會引發股票、期貨等金融產品價格的波動,并且由于各方對事件解讀的觀點不同,對標的價格也會產生不同的影響,故需要對這些事件進行特點分析,通過文本數據解析與語義理解,從多維度建立立體的關聯關系,來滿足投資者對事件更快、更全、更準確的挖掘需求。
?
事件抽取是對文本進行預處理、觸發詞抽取與論元識別等步驟后,從非結構化信息中抽取出特定的元素,并以結構化的形式呈現給用戶。白博士向大家展示了事件抽取的大致流程,首先以基于規則或機器學習的方法來判斷句子的屬性,然后抽取事件骨干,同時圍繞同一事件可能存在的多個表達句子,用實體對齊、同義詞對齊等手段進行泛化,再通過抽取公共子串或“填坑”的方式來“拼湊”完整的事件表達式。
?
金融行業產業鏈上的各元素之間存在著一定的邏輯關系,這些相近的元素可以從詞庫的擴充,子圖近鄰的相似等方面,進行語義理解與詞法分析處理,對NLP進行加持與助力,進一步的,還能基于圖譜路徑進行事件的關聯和推理。知識圖譜在場景識別、關聯查詢、交叉驗證等各種NLP和AI任務上都能起到積極作用。
在事件沿知識圖譜的推理上,白博士以泰國特大洪水與新能源汽車銷量上漲,分別對橡膠行業和下游碳酸鋰電池生產企業股價的影響為例,分析了沿知識圖譜多步推理的原理,此項技術在金融投資領域具有廣泛的需求,可幫助人們及時發現投資機會與潛在風險。
白博士坦言NLP+知識圖譜、事件抽取和推理等方向,尚處在研發應用初級階段,未來發展空間很廣,仍需大家不斷的努力。
阡尋科技將深度發掘自然語言與知識圖譜在金融科技、工業智能化、監管科技領域的應用,為市場帶來股票對話機器人、事件預警、智能資訊、自動報告、智能公告、知識圖譜構建與推理、智能礦山系統等多種產品,打造一個全方位覆蓋行業產業鏈的數字信息平臺。
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的白雪 | NLP加持知识图谱在金融事件挖掘中的应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谷歌、微软、OpenAI等巨头七大机器学
- 下一篇: 揭秘任务型对话机器人(下篇)