白雪 | NLP加持知识图谱在金融事件挖掘中的应用
本文轉(zhuǎn)載自公眾號(hào):阡尋科技。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
9月15日訊,涵蓋金融科技、人工智能及區(qū)塊鏈領(lǐng)域的2018恒生技術(shù)開放日于今日開幕,阡尋科技聯(lián)席CEO、復(fù)旦大學(xué)人工智能方向博士白雪受邀出席本次大會(huì),分享了金融領(lǐng)域事件特點(diǎn)分析、常用的事件抽取方法以及金融知識(shí)圖譜加持NLP等方面的實(shí)踐與心得。與參會(huì)人員共同探討了自然語言與知識(shí)圖譜未來的發(fā)展方向,并對(duì)人工智能技術(shù)在金融領(lǐng)域的應(yīng)用進(jìn)行了展望。
資本運(yùn)作,并購、高管動(dòng)向等事件會(huì)對(duì)金融產(chǎn)品價(jià)格產(chǎn)生沖擊,這些事件會(huì)引發(fā)股票、期貨等金融產(chǎn)品價(jià)格的波動(dòng),并且由于各方對(duì)事件解讀的觀點(diǎn)不同,對(duì)標(biāo)的價(jià)格也會(huì)產(chǎn)生不同的影響,故需要對(duì)這些事件進(jìn)行特點(diǎn)分析,通過文本數(shù)據(jù)解析與語義理解,從多維度建立立體的關(guān)聯(lián)關(guān)系,來滿足投資者對(duì)事件更快、更全、更準(zhǔn)確的挖掘需求。
?
事件抽取是對(duì)文本進(jìn)行預(yù)處理、觸發(fā)詞抽取與論元識(shí)別等步驟后,從非結(jié)構(gòu)化信息中抽取出特定的元素,并以結(jié)構(gòu)化的形式呈現(xiàn)給用戶。白博士向大家展示了事件抽取的大致流程,首先以基于規(guī)則或機(jī)器學(xué)習(xí)的方法來判斷句子的屬性,然后抽取事件骨干,同時(shí)圍繞同一事件可能存在的多個(gè)表達(dá)句子,用實(shí)體對(duì)齊、同義詞對(duì)齊等手段進(jìn)行泛化,再通過抽取公共子串或“填坑”的方式來“拼湊”完整的事件表達(dá)式。
?
金融行業(yè)產(chǎn)業(yè)鏈上的各元素之間存在著一定的邏輯關(guān)系,這些相近的元素可以從詞庫的擴(kuò)充,子圖近鄰的相似等方面,進(jìn)行語義理解與詞法分析處理,對(duì)NLP進(jìn)行加持與助力,進(jìn)一步的,還能基于圖譜路徑進(jìn)行事件的關(guān)聯(lián)和推理。知識(shí)圖譜在場(chǎng)景識(shí)別、關(guān)聯(lián)查詢、交叉驗(yàn)證等各種NLP和AI任務(wù)上都能起到積極作用。
在事件沿知識(shí)圖譜的推理上,白博士以泰國特大洪水與新能源汽車銷量上漲,分別對(duì)橡膠行業(yè)和下游碳酸鋰電池生產(chǎn)企業(yè)股價(jià)的影響為例,分析了沿知識(shí)圖譜多步推理的原理,此項(xiàng)技術(shù)在金融投資領(lǐng)域具有廣泛的需求,可幫助人們及時(shí)發(fā)現(xiàn)投資機(jī)會(huì)與潛在風(fēng)險(xiǎn)。
白博士坦言NLP+知識(shí)圖譜、事件抽取和推理等方向,尚處在研發(fā)應(yīng)用初級(jí)階段,未來發(fā)展空間很廣,仍需大家不斷的努力。
阡尋科技將深度發(fā)掘自然語言與知識(shí)圖譜在金融科技、工業(yè)智能化、監(jiān)管科技領(lǐng)域的應(yīng)用,為市場(chǎng)帶來股票對(duì)話機(jī)器人、事件預(yù)警、智能資訊、自動(dòng)報(bào)告、智能公告、知識(shí)圖譜構(gòu)建與推理、智能礦山系統(tǒng)等多種產(chǎn)品,打造一個(gè)全方位覆蓋行業(yè)產(chǎn)業(yè)鏈的數(shù)字信息平臺(tái)。
OpenKG.CN
中文開放知識(shí)圖譜(簡(jiǎn)稱OpenKG.CN)旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開放與互聯(lián),促進(jìn)知識(shí)圖譜和語義技術(shù)的普及和廣泛應(yīng)用。
點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的白雪 | NLP加持知识图谱在金融事件挖掘中的应用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谷歌、微软、OpenAI等巨头七大机器学
- 下一篇: 揭秘任务型对话机器人(下篇)