當(dāng)前位置：首頁(yè) > 人文社科 > 生活经验 >内容正文

生活经验

机器不学习：浅析深度学习在实体识别和关系抽取中的应用

發(fā)布時(shí)間：2023/11/27 生活经验 31 豆豆

生活随笔收集整理的這篇文章主要介紹了机器不学习：浅析深度学习在实体识别和关系抽取中的应用小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

機(jī)器不學(xué)習(xí) jqbxx.com -機(jī)器學(xué)習(xí)好網(wǎng)站

命名實(shí)體識(shí)別（Named Entity Recognition，NER）就是從一段自然語(yǔ)言文本中找出相關(guān)實(shí)體，并標(biāo)注出其位置以及類(lèi)型，如下圖。命名實(shí)體識(shí)別是NLP領(lǐng)域中的一些復(fù)雜任務(wù)的基礎(chǔ)問(wèn)題，諸如自動(dòng)問(wèn)答，關(guān)系抽取，信息檢索等，其效果直接影響后續(xù)處理的效果，因此是NLP研究的一個(gè)基礎(chǔ)問(wèn)題。

NER一直是NLP領(lǐng)域中的研究熱點(diǎn)，現(xiàn)在越來(lái)越多的被應(yīng)用于專(zhuān)業(yè)的領(lǐng)域，如醫(yī)療、生物等。這類(lèi)行業(yè)往往具有大量的專(zhuān)業(yè)名詞，名詞與名詞之間相互之間存在著不同種類(lèi)的關(guān)系。NER的研究從一開(kāi)始的基于詞典和規(guī)則的方法，基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法，到近年來(lái)基于深度學(xué)習(xí)的方法，NER研究的進(jìn)展趨勢(shì)如下圖所示。

基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法主要包括:隱馬爾可夫模型(HiddenMarkovModel HMM)、最大熵(MaxmiumEntropy,ME)、支持向量機(jī)(Support VectorMachine,SVM)、條件隨機(jī)場(chǎng)( Conditional Random Fields,CRF)等。

隱馬爾可夫模型（HMM）主要利用Viterbi算法求解命名實(shí)體類(lèi)別序列，在訓(xùn)練和識(shí)別時(shí)的效率較高且速度較快。隱馬爾可夫模型適用于一些對(duì)實(shí)時(shí)性有要求以及像信息檢索這樣需要處理大量文本的應(yīng)用,如短文本命名實(shí)體識(shí)別。

最大熵模型（ME）結(jié)構(gòu)緊湊,具有較好的通用性,缺點(diǎn)是訓(xùn)練時(shí)間復(fù)雜性高,有時(shí)甚至訓(xùn)練代價(jià)難以承受,由于需要明確的歸一化計(jì)算,導(dǎo)致計(jì)算開(kāi)銷(xiāo)比較大。

傳統(tǒng)的公認(rèn)比較好的處理算法是條件隨機(jī)場(chǎng)（Conditional Random Field，CRF），它給定一組輸入隨機(jī)變量條件下另一組輸出隨機(jī)變量的條件概率分布模型，其特點(diǎn)是假設(shè)輸出隨機(jī)變量構(gòu)成馬爾可夫隨機(jī)場(chǎng)，它是一種判別式概率模型，是隨機(jī)場(chǎng)的一種。CRF常用于標(biāo)注或分析序列資料，如自然語(yǔ)言文字或是生物序列，在NER中的基本應(yīng)用是給定一系列的特征去預(yù)測(cè)每個(gè)詞的標(biāo)簽。

上圖中，X我們可以看做成一句話(huà)的每個(gè)單詞對(duì)應(yīng)的特征，Y可以看做成單詞對(duì)應(yīng)的標(biāo)簽。這里的標(biāo)簽就是對(duì)應(yīng)場(chǎng)景下的人名、地名等等。

CRF優(yōu)點(diǎn)：立足于局部最優(yōu)解，在已給出z的條件下計(jì)算可能的序列 y 的概率分布。

近年來(lái)隨著深度學(xué)習(xí)的飛速發(fā)展，像RNN、LSTM這些模型在NLP任務(wù)中得到了廣泛的應(yīng)用，其特點(diǎn)在于具備強(qiáng)大的序列建模能力，它們能夠很好地捕捉上下文信息，同時(shí)具備神經(jīng)網(wǎng)絡(luò)擬合非線(xiàn)性的能力，這些都是比CRF具有優(yōu)勢(shì)的地方。LSTM的優(yōu)點(diǎn)在于獲取長(zhǎng)時(shí)間序列上樣本與樣本之間的關(guān)系，而B(niǎo)iLSTM可以更有效的獲取輸入語(yǔ)句前后的特征。BiLSTM+CRF已在NLP多數(shù)場(chǎng)景中表現(xiàn)出非常良好的效果。例如在分詞任務(wù)中，對(duì)比傳統(tǒng)的分詞器，BiLSTM能發(fā)揮雙向獲取句子特征這一優(yōu)勢(shì)，分詞效果更接近人類(lèi)認(rèn)知的感覺(jué)。

關(guān)系抽取2

在當(dāng)前NLP研究中，關(guān)系抽取（relation extraction）任務(wù)被廣泛應(yīng)用于數(shù)據(jù)簡(jiǎn)化和構(gòu)建知識(shí)圖譜中。給定用戶(hù)輸入的一段自然語(yǔ)言，在正確識(shí)別實(shí)體的基礎(chǔ)上，抽取它們之間的關(guān)系就是亟待解決的重要問(wèn)題。目前解決這個(gè)問(wèn)題的方法分為串聯(lián)抽取和聯(lián)合抽取兩類(lèi)。一般傳統(tǒng)的串聯(lián)抽取方法是在實(shí)體抽取的基礎(chǔ)上進(jìn)行實(shí)體之間關(guān)系的識(shí)別。在這種方法中，先期實(shí)體識(shí)別的結(jié)果會(huì)影響到關(guān)系抽取的結(jié)果，前后容易產(chǎn)生誤差累積。針對(duì)這一問(wèn)題，基于傳統(tǒng)機(jī)器學(xué)習(xí)的聯(lián)合模型（Joint model）被提出并逐步用于對(duì)這一類(lèi)的NLP任務(wù)進(jìn)行聯(lián)合學(xué)習(xí)。

聯(lián)合模型的方法主要基于神經(jīng)網(wǎng)絡(luò)的端對(duì)端模型同時(shí)實(shí)現(xiàn)實(shí)體抽取和關(guān)系抽取，這樣做能夠更好的將實(shí)體和其中的關(guān)系信息進(jìn)行結(jié)合。

在論文《Joint Entity and Relation Extraction Based on A Hybrid Neural Network》中，作者提出了混合的神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行命名實(shí)體識(shí)別（NER)和關(guān)系分類(lèi)（RC)。NER和RC使用同一BiLstm網(wǎng)絡(luò)對(duì)輸入進(jìn)行編碼，根據(jù)NER預(yù)測(cè)的結(jié)果對(duì)實(shí)體進(jìn)行配對(duì)，然后將實(shí)體之間的文本使用一個(gè)CNN網(wǎng)絡(luò)進(jìn)行關(guān)系分類(lèi)。

CNN用于關(guān)系分類(lèi)（RC)

通過(guò)底層的模型參數(shù)共享，在訓(xùn)練時(shí)兩個(gè)任務(wù)都會(huì)通過(guò)后向傳播算法來(lái)更新共享參數(shù)來(lái)實(shí)現(xiàn)兩個(gè)子任務(wù)之間的依賴(lài)。

在論文《A neural joint model for entity and relation extraction from biomedical text》中，作者將聯(lián)合學(xué)習(xí)的方法用于生物醫(yī)學(xué)實(shí)體識(shí)別和關(guān)系抽取當(dāng)中，在關(guān)系分類(lèi)時(shí)，輸入的語(yǔ)句首先進(jìn)行依存分析構(gòu)建起依存句法樹(shù)，然后將這種樹(shù)狀結(jié)構(gòu)輸入到Bilstm+RNN的網(wǎng)絡(luò)中進(jìn)行關(guān)系分類(lèi)，如下圖：

通過(guò)以上的方法可以看出，兩個(gè)任務(wù)的網(wǎng)絡(luò)通過(guò)共享參數(shù)的方式聯(lián)合學(xué)習(xí)，訓(xùn)練先進(jìn)行NER，再根據(jù)NER的結(jié)果進(jìn)行關(guān)系分類(lèi)。

今年ACL的Outstanding Paper《Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme》提出了一種新的標(biāo)注策略來(lái)進(jìn)行關(guān)系抽取，采用一種jointly的方法把命名實(shí)體識(shí)別（named entity recognize）和關(guān)系抽取（relation extraction）兩步結(jié)合到一起：通過(guò)一種新的標(biāo)注策略（tagging scheme）把抽取任務(wù)轉(zhuǎn)換為標(biāo)注任務(wù)，然后利用深度學(xué)習(xí)的方法通過(guò)一個(gè)端到端的模型（end-to-end tagging model）來(lái)抽取出最終的結(jié)果。新的標(biāo)注方案示例如下圖：

上圖中“CP”代表“Country-President”，“CF“代表“Company-Founder”，這樣就將原來(lái)的兩個(gè)子任務(wù)完全轉(zhuǎn)換為一個(gè)序列標(biāo)注問(wèn)題，作者使用“BIES”（Begin，Inside，End，Single）進(jìn)行標(biāo)注，來(lái)表示當(dāng)前詞在整個(gè) entity 中的位置，關(guān)系類(lèi)型則來(lái)自于預(yù)先設(shè)定的關(guān)系類(lèi)型集合。用“1”，“2”來(lái)表示entity在關(guān)系中的角色信息，其中“1”表示，當(dāng)前詞屬于三元組（Entity1，RelationType，Entity2）的 Entity1，同理”2”表示，當(dāng)前詞屬于Entity2，根據(jù)標(biāo)注結(jié)果將兩個(gè)相鄰順序?qū)嶓w組合為一個(gè)三元組。例如：通過(guò)標(biāo)注標(biāo)簽可知，“United”與“States”組合形成了實(shí)體“United States”，實(shí)體“United States”與實(shí)體“Trump”組合成了三元組 {United States, Country-President,Trump}。

論文作者主要考慮一個(gè)詞只屬于一個(gè)三元組的情況，對(duì)于三元組重疊問(wèn)題，即多個(gè)三元組都包含同一個(gè)詞的情況，作者暫時(shí)還沒(méi)有考慮。端到端的模型如下圖所示：

模型還是使用 BiLSTM來(lái)進(jìn)行編碼，然后使用參數(shù)共享中的 LSTM 來(lái)進(jìn)行解碼。

這一模型可以用于豐富已有的知識(shí)圖譜資源，例如現(xiàn)在多樣的智能化應(yīng)用，如：自動(dòng)問(wèn)答、智能搜索、個(gè)性化推薦等，都需要知識(shí)圖譜的支撐。

總結(jié)3

參數(shù)共享的方法越來(lái)越多的被用于基于神經(jīng)網(wǎng)絡(luò)的實(shí)體識(shí)別和關(guān)系抽取聯(lián)合學(xué)習(xí)中，這種方法在多任務(wù)中有著廣泛的應(yīng)用且簡(jiǎn)單容易實(shí)現(xiàn)。如何將這兩類(lèi)任務(wù)更好的結(jié)合起來(lái)進(jìn)行端到端關(guān)系抽取任務(wù)是下一步研究的重要趨勢(shì)，我們期待有更好的方法出現(xiàn)

更多精彩內(nèi)容，機(jī)器不學(xué)習(xí)官方網(wǎng)站 jqbxx.com

轉(zhuǎn)載于:https://www.cnblogs.com/jiqibuxuexi/p/8410628.html

總結(jié)

以上是生活随笔為你收集整理的机器不学习：浅析深度学习在实体识别和关系抽取中的应用的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Sublime Text 自动换行
下一篇：蒟蒻吃药计划-治疗系列 #round 2

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

生活经验

机器不学习：浅析深度学习在实体识别和关系抽取中的应用

總結(jié)