日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

人工智能NLP在金融领域的发展趋势和实践经验

發布時間:2023/12/18 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 人工智能NLP在金融领域的发展趋势和实践经验 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者: 鄭驍慶 林金曙

金融服務行業正在愛上“吞噬”文本數據,即自然語言處理。(The financial services industry is falling in love with text crunching—also known as NLP.)

自然語言處理(NLP)在金融科技中主要解決兩端的問題,一端是數據,另一端是人。據估計,90%的數據以非結構化的形式呈現,自然語言處理的目標是將非結構化的數據轉為結構化表示,然后將語言描述相似的內容匯聚,從而估計所描述事件的可靠性和真實性,進而通過事件之間的關聯關系,產生新發現和新洞見,為后續的決策提供依據。對用戶來說,自然語言處理技術讓機器更懂人言,更了解用戶的需求及意圖,從而提供及時、準確、友好的服務。

NLP在金融領域的發展趨勢

細粒度的輿情分析

輿情分析在金融領域的研究起步較早,應用也較為廣泛。大眾對某個事件的評價與態度,與相關資產的價格變動趨勢有很強的相關性。基于這樣的邏輯,可以讓系統自動化收集和分析輿情信息,總結對某事件或某企業的評價。這方面金融行業亟需做得更加細膩,開展細粒度的輿情分析,例如對某企業新發布產品的外觀、功能、價格等各方面評價進行分析,進而形成對產品的完整評價;細粒度還指不能對所有來源的輿情信息一視同仁處理,而是需要考慮評論的出處 。因為某些機構、人員的評價可能帶有一定目的性,需要與一般大眾或獨立性程度較高的第三方評論區別對待。此外,還要考慮評論者在歷史過程中對事件評論的準確率。

突發和意外事件需要格外關注 ,尤其是與當前趨勢相反的事件,這些事件對投資者更有價值,正確預測全新的趨勢有助于捕捉更佳的投資機會。

對話系統引入情感分析與推理

對話系統在智能客服、智能投顧等領域已有廣泛應用,現在的一個發展趨勢是在系統中運用情感分析技術 ,動態跟蹤交互時用戶的情緒變化,可以在發現用戶出現負面情緒時,及時介入人工干預;情緒分析也可作為對話質量評估的指標,判斷對話系統在完成某類任務中是否可靠,并利用歷史交互記錄對系統進行針對化的迭代優化。現在的技術已經可以較準確地實時分析用戶情緒狀態和變化,還可以讓系統在回答中注入和表達特定情感。實驗數據表明,如果對話系統能做出一些安慰、同情等共情性表達,系統友好性和用戶黏度會大大提升,甚至提升對話系統的交互效率

對話系統還需引入智能推理能力 ,這也是一個重要趨勢。傳統對話系統中結合知識庫的方法是將用戶的問題通過語義解析轉化成相應知識庫的查詢語句,然后在知識庫上執行查詢操作,并將查詢結果返回給用戶。這樣的結合方式中,知識庫的作用類似于數據庫,不能發揮知識庫最有價值的能力——使用已知的知識和事實推導出新知識 。知識庫及其上的推理,天然能夠對得出的結論進行解釋,例如在智能投顧過程中,系統給出一個建議,如果用戶要求給出解釋,可以通過跟蹤推理鏈,給出具有一定信服能力的、可解釋性的結果。

更智能的文檔分析

隨著文檔智能技術的發展,在金融領域將會有較大的應用前景。金融領域有大量的文檔需要處理,現在技術上可以實現從文檔中提取關鍵要素,進行文檔細粒度的比對等,以減少繁重的人工工作。例如通過自動對比同一企業的兩份年報(包括財務數據和解釋說明),可以了解企業在一定時期內發生的重要變化。筆者認為,未來的發展趨勢是機器將能更好地理解和解釋文檔,知曉文檔內部互相引證的關系以及復雜文檔的結構關系 ,從而更好地賦能合同分析、檢測,這方面現在也已經有了一些應用。在文檔摘要方面,現在市場的一種需求是要能針對用戶特定問題產生摘要 ,特別是對長文本,需要根據文本內容快速回答用戶的問題并指出答案出處。

與知識圖譜結合

知識圖譜與自然語言處理相結合的一個趨勢是:需要能夠圍繞某個主體,將一段時間所發生的相關事件進行聚類,并將事件聚類結果與其他主體之間的關系進行建模,這些關系可以作為構建金融定量分析模型的一個影響因素,將知識圖譜的信息有效地在模型構建上發揮作用 ,從而建立不同變量之間的關系,產生更具說服力、且有數據支持的結論。

為對抗攻擊做好準備

對抗攻擊對金融業信息安全的挑戰目前還難以評估,但行業需要為最壞的情況做好準備。神經網絡和深度學習模型易被攻擊的現象最早在圖像領域被發現,在自然語言處理也觀察到類似現象,例如原始語句“I really like this movie”是對movie(電影)的正向評價,但是采用對抗攻擊算法,每次有目的地用近義詞替換句子中的一個詞匯,最后生成“We truly like the show”的句子,雖然人仍然認為是正面評價,模型卻判斷該句子表達了負面情感。類似情況會嚴重影響模型的魯棒性,降低模型分析結果的可靠性 。我們要在對抗攻擊防御上做好技術儲備,構建能夠應付對抗樣本的魯棒模型。另一方面,對抗攻擊不僅帶來了挑戰,也帶來了機遇:它提供了一種迭代發現當前模型弱點、彌補弱點(攻擊和訓練不斷切換)的模型訓練方法;在訓練樣本不足時,也有助于自動產生高質量的訓練樣本

金融NLP實踐經驗:從語料到模型

自然語言處理落地金融場景,主要包括原始文本解析、文本標注、模型訓練、模型評估、模型上線部署等流程,讓快速發展的自然語言處理技術更快、更好地落地,主要有幾個關鍵點:

語料庫維護 :這是自然語言處理應用落地的保障,語料和標簽需要形成體系,沉淀之后可以為其他業務場景復用。語料庫的維護需要考慮語料類型的多樣性,包括文本、圖像、語音等,能否實現統一管理、檢索;不同業務場景需要的語料格式不同,能否統一管理。

標注質量 :標注的質量往往會決定模型的產出效果。在標注之前,需要對原始語料進行清洗,例如:去掉相似語料,讓標注更具多樣性;很多大盤點評、漲停揭秘資訊等都是無用的信息,要進行數據降噪。在標注規范方面,文本分類、短文本相似度、文本信息抽取最為重要,要對每個標注需求定義進行質量把控,明確標注需求及驗收規范、標注過程要進行質量監督。簡而言之,“高效標注工具 + 嚴格標注規范 + 數據積累 + 專業標注團隊 = 高質量語料 。”

模型訓練及效果驗證 :需要一定的算力支持;與學術界不同,金融領域的應用要減少維護成本與調試成本,模型不能太復雜;要對模型訓練結果進行實時跟蹤。

預訓練模型及自學習平臺 :基于公開數據并融合金融行業問答數據、資訊公告以及研報數據面向智能問答、智能文檔處理、資訊研報標簽等場景,恒生NLP提供金融預訓練模型(相比開源通用預訓練模型F1提升3 ~ 5%),且配套有獨立研發自學習平臺,從而有效解決金融機構本地部署模型快速迭代的需求問題。

在金融NLP實踐的過程中,恒生基于嚴格的標注規范積累了大量高質量語料,在模型開發、訓練與管理方面也已形成相關工具、平臺。隨著越來越多、越來越精彩的自然語言處理技術從前沿走向應用,恒生也將與行業一同探索新技術在更多業務場景的應用。

更多金融科技文章見恒生LIGHT云社區

總結

以上是生活随笔為你收集整理的人工智能NLP在金融领域的发展趋势和实践经验的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。