日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

金融情报挖掘:面向公开文本的期货事件聚合与传导因素分析

發(fā)布時間:2024/7/5 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 金融情报挖掘:面向公开文本的期货事件聚合与传导因素分析 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

金融情報挖掘是情報領(lǐng)域的一個重要分支,通過對金融領(lǐng)域信息進(jìn)行提取和分析,發(fā)現(xiàn)關(guān)聯(lián)線索,對傳導(dǎo)關(guān)聯(lián)進(jìn)行建模,能夠挖掘出市場變動的規(guī)律,最終輔助決策。
例如,國內(nèi)外資本市場,衍生品市場熱點不斷,如“原油跌停”、“智利地震”、“美股暴跌”、“華鑫期貨違反法律法規(guī)”、“期貨公司抵制文華財經(jīng)”等,這些事件涉及多個金融機(jī)構(gòu)、人物、產(chǎn)品等多類實體。
通過輿情分析,尋找這些事件之間的傳導(dǎo)關(guān)系,對市場產(chǎn)品(國債期貨、股指期貨)趨勢的影響有著重要意義。
通過輿情分析,尋找這些事件之間的傳導(dǎo)關(guān)系,對市場產(chǎn)品(國債期貨、股指期貨)趨勢的影響有著重要意義。
本文以該任務(wù)為研究對象,對任務(wù)的抽象、任務(wù)的評估、任務(wù)的實現(xiàn)以及總結(jié)等幾個方面的內(nèi)容進(jìn)行介紹。

一、任務(wù)的抽象

每天公開的資訊文本中包含了大量的期貨相關(guān)信息,以“事件”為角度,對資訊中關(guān)聯(lián)的事件、實體、實體關(guān)系、事件關(guān)系進(jìn)行輿情分析,目標(biāo)是挖掘出事件之間的傳導(dǎo)關(guān)系、事件的輿情信息以及該事件下對市場可交易產(chǎn)品趨勢的影響。

為此,我們對該任務(wù)進(jìn)行進(jìn)一步抽象,即:
輸入:
某一時間段中的財經(jīng)領(lǐng)域公開文本

輸出:
1)以該公開文本數(shù)據(jù)集為基礎(chǔ)形成的事件聚合;
2)熱點事件列表與排序;
3)事件與資訊、資訊與實體之間的實體關(guān)聯(lián);
4)輿情數(shù)據(jù)對實體影響的可解釋性路徑及大小;
5)影響實體走勢的因素分析與排行。

二、 任務(wù)的評估

信息提取技術(shù)、事件聚合技術(shù)、知識圖譜技術(shù)以及時序分析技術(shù)是實現(xiàn)這一目標(biāo)的重要技術(shù)點。其中:

信息提取,需要完成對既定的實體類型、實體關(guān)系以及實體屬性的提取,事件識別以及事件因果邏輯提取;

事件聚合,通過對相似文本進(jìn)行判定和聚合,利用資訊去重與聚合技術(shù),形成不同事件主題下相關(guān)的文本聚類,得到事件與文本之間的關(guān)聯(lián)關(guān)系;

知識圖譜,包括對期貨領(lǐng)域知識的組織、構(gòu)建以及應(yīng)用(具體包括關(guān)聯(lián)可視化以及關(guān)系推理等);

時序分析,包括在不同時間窗口中的事件序列識別、市場交易物影響走勢推理、可解釋性的影響因素分析等。包括事件推理以及因素分析兩個核心技術(shù)點。

這些核心技術(shù)點在我們團(tuán)隊以往的工作中均有體現(xiàn),因此,這項任務(wù)具備較高的技術(shù)可行性。

三、任務(wù)的實現(xiàn)

1、 數(shù)據(jù)與技術(shù)路線的準(zhǔn)備

我們選擇了2019年至2020年間,共168萬期貨相關(guān)資訊,并結(jié)合多種外部知識庫,如:2400萬因果事理邏輯知識庫、37萬產(chǎn)業(yè)鏈知識庫、期貨類實體庫、關(guān)聯(lián)關(guān)系庫、期貨風(fēng)險標(biāo)簽等,進(jìn)行了過程所需數(shù)據(jù)的擴(kuò)充和增強(qiáng)。

在技術(shù)路線的實現(xiàn)上,我們確立了從“資訊采集”到“影響路徑因素與輿情分析”和“資訊影響庫”以及“熱點資訊屬性庫”三個最終數(shù)據(jù)庫的數(shù)據(jù)生產(chǎn)路線,如下圖所示:


圖1-期貨事件聚合與傳導(dǎo)因素分析技術(shù)路線

2、 熱點事件的資訊聚合

在熱點事件的資訊聚合中,針對輸入的資訊集合,對資訊進(jìn)行主題向量化表征,并進(jìn)行關(guān)聯(lián)性資訊挖掘和資訊聚類。


圖2-熱點事件的資訊聚合路線與效果

3、 面向資訊的事件識別

針對輸入的資訊,對資訊中的既定實體事件進(jìn)行識別和提取,并提取該事件在資訊中的權(quán)重。


圖3-面向資訊的事件識別路線與效果

4、 面向事件的主體識別

我們針對事件中提及到的期貨類實體進(jìn)行識別,確立了3大類14小類,結(jié)合規(guī)則與序列標(biāo)注的實體識別模型,在識別后進(jìn)行實體統(tǒng)一和標(biāo)準(zhǔn)化。

圖4-面向事件的事件識別路線與效果

5、 面向事件的因果邏輯識別

針對資訊文本中存在的事件因果邏輯關(guān)聯(lián),我們采用了面向顯式因果邏輯的有監(jiān)督提取方法。目前,基于這種方法,我們已經(jīng)成功形成2400余萬因果邏輯等大規(guī)模事理知識庫資源。


圖5-面向事件的因果邏輯識別路線與效果

6、 事件的風(fēng)險標(biāo)簽識別

我們根據(jù)業(yè)務(wù)理解自行定義了期貨相關(guān)事件的風(fēng)險標(biāo)簽,一共包括五類風(fēng)險標(biāo)簽(市場風(fēng)險、流動性風(fēng)險、法律與政策風(fēng)險、操作風(fēng)險和信用風(fēng)險)。

針對每類風(fēng)險,我們根據(jù)自己的業(yè)務(wù)理解設(shè)計了一系列的特征。如信用風(fēng)險的核心是存在違約行為,因此信用風(fēng)險的特征包括是否發(fā)生違約事項、是否存在違約的主體以及與違約相關(guān)的屬性,如合約到期時間等。


圖6-事件的風(fēng)險標(biāo)簽識別效果

7、 事件的情感分析

針對資訊事件情感分析,我們分別進(jìn)行了面向篇章級主題段落的情感計算以及基于實體識別與語義依存的實體級情感計算,以形成不同維度的事件輿情指標(biāo)。


圖7-事件的情感分析識別效果

8、 熱點事件影響推理路徑生成

基于熱點資訊,基于資訊提及的事件,借助外部邏輯推理知識庫與推理規(guī)則進(jìn)行標(biāo)的物推理。


圖8-熱點事件影響推理路徑生成路線與效果

9、 期貨實體影響情緒因素分析

針對期貨實體的影響情緒因素分析,我們基于歷史消息面的期貨輿情智子生成,面向39個大宗商品期貨,提供了2012年至今的輿情走勢,經(jīng)過對比發(fā)現(xiàn),期貨的輿情走勢與對應(yīng)價格的走勢基本對應(yīng)。


圖9-期貨實體影響情緒因素分析效果

10、 期貨實體影響路徑因素分析

我們以影響路徑中的節(jié)點為期貨影響因素,并以影響路徑中事件的貝葉斯網(wǎng)絡(luò)概率為轉(zhuǎn)移概率,配合各類量化指標(biāo),融合產(chǎn)業(yè)鏈、因果事理邏輯、實體關(guān)聯(lián)網(wǎng)絡(luò),實現(xiàn)對該影響路徑的因素分析。根據(jù)因素權(quán)重的大小,我們得到了其影響的因素排行。

圖10-期貨實體影響路徑分析效果

四、 任務(wù)的總結(jié)

經(jīng)過對任務(wù)的抽象、任務(wù)的評估以及任務(wù)的實現(xiàn),我們在2019年至2020年,共168萬的期貨相關(guān)資訊中,結(jié)合我們團(tuán)隊積累形成的多種外部知識庫,初步完成了任務(wù)所需功能,取得了較為滿意的效果。具體包括:

1、實現(xiàn)了資訊去重與相似性事件聚合;

2、完成了資訊事件提取、實體提取、實體關(guān)系提取與因果邏輯提取;

3、確定了期貨相關(guān)的5大類風(fēng)險,并進(jìn)行風(fēng)險判定;

4、針對不同維度,提供了資訊篇章級、實體級兩個層次的情感計算;

5、提出了基于外部事理庫與推理規(guī)則的影響路徑生成方法,對特定期貨進(jìn)行了影響因素分析和輿情分析。

不過,在整個任務(wù)的實現(xiàn)過程中,存在多個可改進(jìn)之處:

1、相關(guān)數(shù)據(jù)缺失,若有更多的外部數(shù)據(jù)(工商、實體關(guān)聯(lián)數(shù)據(jù)、關(guān)聯(lián)量化數(shù)據(jù)),可優(yōu)化當(dāng)前影響推理效果。

2、算法的效果需要有具體業(yè)務(wù)知識作為適配,將更多的業(yè)務(wù)知識融入到模型算法中,可進(jìn)一步提升算法對數(shù)據(jù)的針對性和適用性。

總結(jié)

以上是生活随笔為你收集整理的金融情报挖掘:面向公开文本的期货事件聚合与传导因素分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。