日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

《自然语言处理(哈工大 关毅 64集视频)》学习笔记:第七章 句法分析技术

發(fā)布時(shí)間:2024/1/1 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《自然语言处理(哈工大 关毅 64集视频)》学习笔记:第七章 句法分析技术 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

視頻列表:
43 句法分析技術(shù)(一)
44 句法分析技術(shù)(二)
45 句法分析技術(shù)(三)
46 句法分析技術(shù)(四)
47 句法分析技術(shù)(五)

43 句法分析技術(shù)(一)

第七章 句法分析技術(shù)

什么是句法分析

  • 判斷輸入的詞序列能否構(gòu)成一個(gè)合乎語法的句子,確定合乎語法句子的句法結(jié)構(gòu)
  • 運(yùn)用句法規(guī)則和其他知識(shí)將輸入句子中詞之間的線性次序,變成一個(gè)非線性的數(shù)據(jù)結(jié)構(gòu)(例如短語結(jié)構(gòu)樹或有向無環(huán)圖)

為什么要進(jìn)行句法分析

  • 例一:音字轉(zhuǎn)換例
    一只小花貓
  • 例二:機(jī)器翻譯示例
    Jan hit the girl with long hair
    Jan hit the girl with a hammer
  • 例三:信息檢索例
    哪個(gè)球隊(duì)獲得了亞洲杯冠軍?
    日本隊(duì)擊敗中國隊(duì)獲得亞洲杯冠軍
  • 例四:語法歧義:一個(gè)句子對(duì)應(yīng)著幾種句法分析結(jié)果
    “咬死了獵人的狗”
    “那只狼咬死了獵人的狗”
    “那只咬死了獵人的狗失蹤了”

漢語句法分析的獨(dú)特性

根據(jù)朱德熙《語法答問》《語法講義》

  • 漢語沒有形態(tài)
  • 語序靈活
  • 詞類和句法成分不存在一一對(duì)應(yīng)的關(guān)系
  • 漢語句子的構(gòu)造原則與詞組的構(gòu)造原則基本上是一致的
  • 漢語語法形式化工作滯后

句法分析系統(tǒng)

一個(gè)句法分析系統(tǒng)通常由兩部分組成:

形式語法體系

  • 匹配模式
    基于模板的方法
    短語結(jié)構(gòu)語法
  • 句法規(guī)則
  • 特征制約
  • 語義解釋
  • 擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)
  • 樹鄰接語法(TAG)
44 句法分析技術(shù)(二)
  • 基于合一運(yùn)算的語法(廣義短語結(jié)構(gòu)語法、詞匯功能語法、功能合一語法、基于中心詞驅(qū)動(dòng)的短語結(jié)構(gòu)語法(HPSG))
  • 基于詞的語法(鏈語法、依存語法、配價(jià)語法)

分析控制機(jī)制

  • 模式匹配技術(shù)

  • 基于短語結(jié)構(gòu)語法分析算法(厄爾利( Earley )分析算法、富田勝( Tomida )分析算法、線圖(Chart)分析算法、確定性分析算法等等)

  • 基于擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)的分析算法

  • 鏈分析算法


  • G=(N,∑,P,S)G = (N,\sum ,P, S)=(N,,P,S)是一個(gè)文法,α→β ∈ P

  • 0型文法
    對(duì)α→β不作任何限制

  • 1型文法
    |α|≤|β|

  • 2型文法:上下文無關(guān)文法
    α∈N

  • 3型文法:正則文法
    A→aB或A→a: G是右線性文法,L(G)是3型語言
    A→Ba或A→a: G是左線性文法,L(G)是3型語言

  • 在自然語言處理中研究和應(yīng)用較多的是2型文法和3型文法

推導(dǎo)

  • 一個(gè)字串的推導(dǎo)是一系列文法規(guī)則的應(yīng)用
    S→NP VP →John V NP →John V NP PP →John ate fish P NP →John ate fish with bone
  • 這一推導(dǎo)的過程可以用分析樹來表示

    根據(jù)某上文下無關(guān)文法從起始非終結(jié)符可能推導(dǎo)出的所有字串的集合稱為由該CFG定義的語言

CFG的形式化定義

一個(gè)CFG是一個(gè)四元組G=&lt;N,∑,P,S&gt;G = &lt;N,\sum ,P, S&gt;=<N,,P,S>
N是非終結(jié)符的集合
∑\sum是終結(jié)符的集合
P是產(chǎn)生式的集合,其中每個(gè)產(chǎn)生式形如:
A→αA\rightarrow \alphaAα
A是非終結(jié)符
α\alphaα是由終結(jié)符與非終結(jié)符構(gòu)成的字串
S是一個(gè)起始非終結(jié)符

上下文無關(guān)文法示例(context free grammar)

語言的合法性

概率上下文無關(guān)文法(Probabilistic (Stochastic) Context Free Grammar)

隨機(jī)上下文無關(guān)語法可以直接統(tǒng)計(jì)語言學(xué)中詞與詞、詞與詞組以及詞組與詞組的規(guī)約信息,并且可以由語法規(guī)則生成給定句子的概率。

定義

定義:一個(gè)隨機(jī)上下文無關(guān)語法(PCFG)由以下5部分組成:
(1)一個(gè)非終結(jié)符號(hào)集N
(2)一個(gè)終結(jié)符號(hào)集∑
(3)一個(gè)開始非終結(jié)符S∈N
(4)一個(gè)產(chǎn)生式集R
(5)對(duì)于任意產(chǎn)生式r∈R,其概率為P?
產(chǎn)生式具有形式X→Y,其中,X∈ N, Y ∈(N∪ ∑)*
∑λP(X→λ)=1{\sum_{}^{\lambda }}P(X\rightarrow \lambda )=1λ?P(Xλ)=1

PCFG的三個(gè)基本假設(shè)

  • CFG的簡單概率拓廣∑λP(X→λ)=1{\sum_{}^{\lambda }}P(X\rightarrow \lambda )=1λ?P(Xλ)=1
  • 基本假設(shè)
    位置無關(guān)(Place invariance)
    上下文無關(guān)(Context-free)
    祖先無關(guān)(Ancestor-free)
  • 分析樹的概率等于所有施用規(guī)則概率之積

    P(tree1)=1/22/32/3=2/9
    P(tree2)=1/21/31/3=1/18
    P(tree3)=1/21/2=1/4
    P(tree4)=1/21/2=1/4

PCFG的三個(gè)基本問題

1、一個(gè)語句W=w1w2….wnW=w_{1}w_{2}….w_{n}W=w1?w2?.wn?的P(W|G),也就是產(chǎn)生語句W的概率?
P(W∣G)P(W|G)P(WG)
2、在語句W的句法結(jié)構(gòu)有歧義的情況下,如何快速選擇最佳的語法分析(parse) ?
argmaxtreeP(tree∣W,G)\underset{tree}{argmax}P(tree|W,G)treeargmax?P(treeW,G)
3、如何從語料庫中訓(xùn)練G的概率參數(shù),使得P(W|G)最大
argmaxGP(tree∣W,G)\underset{G}{argmax}P(tree|W,G)Gargmax?P(treeW,G)
-問題1&2解決思路

向內(nèi)(Inside)算法

非終結(jié)符A的內(nèi)部概率(Inside probability)
定義為根據(jù)文法G從A推出詞串wi...wjw_{i}...w_{j}wi?...wj? 的概率,
記為αi,j(A)\alpha _{i,j}(A)αi,j?(A),
i≤ji\leq jij
αi,j(A)\alpha _{i,j}(A)αi,j?(A)稱為向內(nèi)變量

45 句法分析技術(shù)(三)
  • 向內(nèi)概率公式

向內(nèi)算法計(jì)算示例:
S→NP VP 1.0 NP→NP PP 0.4
PP→P NP 1.0 NP→John 0.1
VP→V NP 0.7 NP→bone 0.18
VP→VP PP 0.3 NP→star 0.04
P→with 1.0 NP→fish 0.18
V→ate 1.0 NP→telescope 0.1


問題2


Viterbi 算法

輸入: G=(S,N,∑,R,P),字符串W=w1w2….wnW=w_{1}w_{2}….w_{n}W=w1?w2?.wn?
輸出:t* ( W在G下最可能的分析樹)

Viterbi算法示例(自底向上)

問題3 參數(shù)訓(xùn)練問題-有指導(dǎo)學(xué)習(xí)方法

從樹庫直接統(tǒng)計(jì)——Treebank Grammar
最大似然估計(jì)
依賴于艱巨的工程:樹庫建設(shè)

PCFG的優(yōu)缺點(diǎn)

  • 優(yōu)點(diǎn)
    可以對(duì)句法分析的歧義結(jié)果進(jìn)行概率排序
    提高文法的容錯(cuò)能力(robustness)
  • 缺點(diǎn)
    沒有考慮詞對(duì)結(jié)構(gòu)分析的影響
    沒有考慮上下文對(duì)結(jié)構(gòu)分析的影響
    許多當(dāng)前的獲得較高精度的句法分析系統(tǒng)以PCFG為基礎(chǔ)
46 句法分析技術(shù)(四)

淺層句法分析技術(shù)

從完全句法分析(complete parsing)到淺層句法分析(shallow parsing)

  • 真實(shí)語料的復(fù)雜性
  • 語言知識(shí)的不足
  • 提高分析的效率
  • 應(yīng)用目標(biāo)驅(qū)動(dòng)
  • 淺層分析的其他名稱:部分分析(partial parsing),組塊分析( chunking )

基于HMM的淺層分析技術(shù)

識(shí)別目標(biāo):非遞歸的NP
組塊分析:在線性序列中插入括號(hào),來標(biāo)示組塊邊界
[The/DT prosecutor/NN] said/VB in/IN [closing/NN] that/CS …

級(jí)聯(lián)式有限狀態(tài)句法分析

(1)從左向右掃描輸入字符串,按照Li層級(jí)上的正則表達(dá)式模式進(jìn)行歸約,得到新的模式序列,對(duì)于輸入串中無法歸約的符號(hào),直接輸出;
(2)i=i+1,在新的Li層級(jí)上,用正則表達(dá)式模式進(jìn)行歸約
(3)不斷進(jìn)行上述步驟,直到無法歸約為止;
(4)如果歸約過程中有多種選擇,以覆蓋范圍最大的歸約子串為輸入結(jié)果

47 句法分析技術(shù)(五)

小結(jié)

  • 以PCFG為重點(diǎn)介紹了近年來句法分析技術(shù)的基本原理與方法
  • 句法分析是當(dāng)前語言處理技術(shù)的瓶頸問題之一
  • 句法分析是語義分析(更深層次的語言理解)的必由之路
  • 句法是形式、語義是內(nèi)容
  • 句法的強(qiáng)制性和語義的決定性
  • 句法系統(tǒng)和語義系統(tǒng)是兩個(gè)不同的系統(tǒng),它們各自獨(dú)立而又相互依存,彼此的對(duì)應(yīng)關(guān)系十分復(fù)雜

致謝
關(guān)毅老師,現(xiàn)為哈工大計(jì)算機(jī)學(xué)院語言技術(shù)中心教授,博士生導(dǎo)師。通過認(rèn)真學(xué)習(xí)了《自然語言處理(哈工大 關(guān)毅 64集視頻)》1(來自互聯(lián)網(wǎng))的課程,受益良多,在此感謝關(guān)毅老師的辛勤工作!為進(jìn)一步深入理解課程內(nèi)容,對(duì)部分內(nèi)容進(jìn)行了延伸學(xué)習(xí)2 3 456,在此分享,期待對(duì)大家有所幫助,歡迎加我微信(驗(yàn)證:NLP),一起學(xué)習(xí)討論,不足之處,歡迎指正。

參考文獻(xiàn)


  • 《自然語言處理(哈工大 關(guān)毅 64集視頻)》(來自互聯(lián)網(wǎng)) ??

  • 王曉龍、關(guān)毅 《計(jì)算機(jī)自然語言處理》 清華大學(xué)出版社 2005年 ??

  • 哈工大語言技術(shù)平臺(tái)云官網(wǎng):http://ltp.ai/ ??

  • Steven Bird,Natural Language Processing with Python,2015 ??

  • Claude E. Shannon. “Prediction and Entropy of Printed English”, Bell System Technical Journal 30:50-64. 195 ??

  • An Empirical Study of Smoothing Techniques for Language Modeling, Stanley F. Chen ??

  • 總結(jié)

    以上是生活随笔為你收集整理的《自然语言处理(哈工大 关毅 64集视频)》学习笔记:第七章 句法分析技术的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 91av爱爱| 国产熟妇另类久久久久 | 精品人妻视频在线 | 色小说综合| 日韩精品视频免费看 | 国产精品熟女视频 | 久色视频 | 日本理论视频 | 无码精品久久久久久久 | 依依激情网 | 亚洲超碰在线观看 | 99精品欧美一区二区三区综合在线 | 男人网站在线观看 | 日韩少妇裸体做爰视频 | 黄色一级大片在线免费看产 | 懂色av一区二区三区免费观看 | 欧美男女激情 | 国产农村妇女精品一区二区 | 欧美极品在线视频 | 国产成人精品一区在线播放 | 91午夜精品 | 三级4级全黄60分钟 成人自拍视频 | 懂色av成人一区二区三区 | 国产精品18久久久 | 免费黄色在线播放 | xx色综合| 高hhhhh| 老师张开让我了一夜av | 免费午夜人成电影 | av一区二区三区 | 亚洲天堂一区在线观看 | 久久久久午夜 | 国产高清免费在线 | 成年视频在线观看 | 操日韩| 日本在线观看一区二区三区 | xxxx亚洲 | 成人国产片女人爽到高潮 | 一级片99| 女性女同性aⅴ免费观女性恋 | 自拍偷拍 国产 | 美女扒开腿让男人操 | 男女国产视频 | 日韩国产欧美一区二区 | 亚洲欧美网 | 国产情侣自拍一区 | 亚洲另类色图 | 国产大屁股喷水视频在线观看 | 奇米影视888| 成人在线观看91 | 奇米视频在线 | 性xxxxbbbb| 国产日韩精品一区二区 | 国产国语老龄妇女a片 | 中文字幕韩日 | 婷婷去俺也去 | 男女互操在线观看 | 色777| 疯狂撞击丝袜人妻 | 最新色网址 | 免费在线观看你懂的 | 第一宅男av导航入口 | 富婆如狼似虎找黑人老外 | 国产一及片| 中文字幕在线日韩 | 欧美极品少妇xxxxⅹ免费视频 | 一级片黑人 | 欧美在线不卡视频 | 男人插女人的网站 | 丰满少妇高潮在线观看 | 日本一区二区不卡视频 | 国产无遮挡18禁无码网站不卡 | 国产字幕av | 免费看国产片在线观看 | 成人久久久久久 | 捆绑裸体绳奴bdsm亚洲 | 成人乱人乱一区二区三区一级视频 | 少妇色综合| 黄色免费观看网站 | 亚洲精品av在线 | 国产一级在线播放 | 亚洲 自拍 另类 欧美 丝袜 | 亚洲av成人无码久久精品 | 91久久精品一区二区 | 97九色 | 国产制服丝袜在线 | 韩国黄色大片 | 丝袜黄色片 | 在线色综合 | 日韩经典一区 | 天天干天天干天天干天天 | 51调教丨国产调教视频 | 性色一区 | 久久免费高清 | 国产www免费 | 神马久久久久久久久久久 | 欧美日韩网站 | 91香蕉视频在线 | 香蕉在线观看视频 |