日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

NLP复习资料(5)-第九章 句法分析

發(fā)布時(shí)間:2023/12/13 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 NLP复习资料(5)-第九章 句法分析 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

NLP復(fù)習(xí)資料-第九章

  • 1.短語結(jié)構(gòu)分析
  • 2.短語結(jié)構(gòu)分析方法的評估指標(biāo)
  • 3依存句法分析器設(shè)計(jì)P13
  • 4依存句法分析器性能評價(jià)
  • 5短語結(jié)構(gòu)與依存結(jié)構(gòu)能夠相互轉(zhuǎn)換
  • 6漢英句法結(jié)構(gòu)對比
  • 7漢語長句的層次化句法分析

國科大,宗老師《自然語言處理》課程復(fù)習(xí)筆記,個(gè)人整理,僅供參考。

1.短語結(jié)構(gòu)分析

(1)基于CFG規(guī)則的分析:沒法解決歧義問題。

(2)基于PCFG的分析:能夠解決歧義問題,但是概率計(jì)算條件過于苛刻)

(1.1)基于CFG規(guī)則的兩種方法:線圖分析法、CYK方法

線圖分析法: P20例子掌握了就差不多了。詞性序列作為線圖的邊,依據(jù)規(guī)則不斷構(gòu)成新的弧,弧的標(biāo)記為規(guī)則的左邊,弧連接的詞性串為規(guī)則的右邊。最后將弧轉(zhuǎn)換成節(jié)點(diǎn),節(jié)點(diǎn)轉(zhuǎn)換成邊,就能得到句法分析樹。P30(時(shí)間復(fù)雜度為Kn3Kn^3Kn3

CYK方法: P49的例子,(識別矩陣上的操作)識別矩陣的主對角線上是詞語,次對角線上是對應(yīng)的詞性標(biāo)注,再次對角線上是依據(jù)規(guī)則約規(guī)的規(guī)則左端標(biāo)記,直至,最有上角的位置標(biāo)記為S,由識別矩陣就可以構(gòu)造句法分析樹。

(1.2)基于PCFG的分析:概率上下文無關(guān)文法

在上下文無關(guān)文法的基礎(chǔ)上,每一條文法都有一定的出現(xiàn)概率,那么利用這些規(guī)則轉(zhuǎn)換而成的句法分析樹每個(gè)節(jié)點(diǎn)周圍都會帶有概率標(biāo)記,通過概率規(guī)則,計(jì)算整棵樹的概率(實(shí)際上是所有概率連乘),概率最大的樹為最有可能的分析樹。由于最大概率的挑選準(zhǔn)則,使得PCFG可以克服歧義問題,但是概率模型太依靠于語料庫。P64句法分析樹概率計(jì)算

PCFG的三個(gè)問題(和HMM模型有的一拼)P73:
->快速計(jì)算P(W|G):內(nèi)向算法:遞歸的算法(不會考算法吧)
->選擇最佳句法結(jié)構(gòu)樹:viterbi算法:viterbi變量對應(yīng)的最大概率,
->調(diào)整G使得P(W|G)最大:巴拉巴拉,我覺的不用記吧

基于PCFG的語法分析實(shí)例:
在CYK的基礎(chǔ)上多了每個(gè)小格子多了概率標(biāo)記,最后可以計(jì)算句法分析樹的概率P103

2.短語結(jié)構(gòu)分析方法的評估指標(biāo)

P125精度、召回率、f-measure、P127交叉括號數(shù)(最好記一下)

P132 頁的交叉括號數(shù)為0,交叉括號的的準(zhǔn)確率為100% (不甚理解)

3依存句法分析器設(shè)計(jì)P13

2.1依存句法結(jié)構(gòu)描述—有向圖、依存樹

2.2 分析算法:
生成式分析方法:score(x,y|參數(shù))找打打分最高的結(jié)果作為分析結(jié)果
判別式分析方法:最大生成樹模型,加權(quán)和分值最高的邊的組合
決策式分析方法:移進(jìn)-約歸算法,arc-eager算法:左弧、右弧、移動、約歸、P33實(shí)現(xiàn)一個(gè)句法分析器:在每個(gè)狀態(tài)下依據(jù)特征決定下一步該采取的行動。通過標(biāo)記數(shù)據(jù)集合得到特征集合,構(gòu)造動作分析器,就是記錄一系列上下文轉(zhuǎn)換情況,在應(yīng)用時(shí),查找轉(zhuǎn)換規(guī)則即可。

4依存句法分析器性能評價(jià)

無標(biāo)記正確率(支配關(guān)系寫對就行,分母是輸出句子的分詞數(shù)目)

帶標(biāo)記正確率(支配關(guān)系和支配類型都得對,分母是輸出句子的分詞數(shù)目)

依存正確率(不帶根節(jié)點(diǎn)的正確率,分母是輸出句子的分詞數(shù)目-根的數(shù)目)

根正確率(正確根數(shù)/句子數(shù))

完全匹配率(正確根的句子/總句子)

5短語結(jié)構(gòu)與依存結(jié)構(gòu)能夠相互轉(zhuǎn)換

短語->依存P52(中心詞抽取規(guī)則,產(chǎn)生中心此表-)每個(gè)節(jié)點(diǎn)中心詞抽取->非中心節(jié)點(diǎn)依存到中心節(jié)點(diǎn)上)

6漢英句法結(jié)構(gòu)對比

P59至少記住兩個(gè)吧

漢語功能詞少;
漢語右部為中心,英語左部為中心;
漢語中省略主語的請款經(jīng)常存在(他認(rèn)為()是正確的)

7漢語長句的層次化句法分析

(p66分割句子-子句句法分析-分析子句之間的關(guān)系-最終得到整個(gè)句子的最大概率分析樹)

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎

總結(jié)

以上是生活随笔為你收集整理的NLP复习资料(5)-第九章 句法分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。