NLPPython笔记——WordNet
WordNet是一種面向語(yǔ)義的英語(yǔ)詞典,由Princeton大學(xué)的心理學(xué)家、語(yǔ)言學(xué)家和計(jì)算機(jī)工程師聯(lián)合設(shè)計(jì)。它不是光把單詞以字母順序排列,而且按照單詞的意義組成一個(gè)“單詞的網(wǎng)絡(luò)”。
NLTK庫(kù)中包含了英語(yǔ)WordNet,里面共有155287個(gè)詞以及117659個(gè)同義詞集合。常用操作如下:
1. 加載wordnet
from nltk.corpus import wordnet as wn2. 得到同義詞集
wn.synsets('motorcar')3. 同義詞集的詞條
wn.synset('car.n.01').lemmas()4. 同義詞集的詞條名
wn.synset('car.n.01').lemma_names()5. 同義詞集的定義
wn.synset('car.n.01').definition()6. 同義詞集的使用例句
wn.synset('car.n.01').examples()7. 同義詞集的上位詞
wn.synset('car.n.01').hypernyms()8. 同義詞集的下位詞
wn.synset('car.n.01').hyponyms()9. 同義詞集的蘊(yùn)含關(guān)系
wn.synset('walk.v.1').entailments()10. 同義詞集中詞條的反義詞
wn.lemma('supply.n.02.supply').antonyms()11. 同義詞集的深度
使用synset對(duì)象的min_depth方法來(lái)量化對(duì)象的普遍性概念,原理上其實(shí)在查找對(duì)象在層次結(jié)構(gòu)所在的層次。
wn.synset('car.n.01').min_depth()12. 兩同義詞集的相似度
使用synset對(duì)象的path_similarity方法可以測(cè)量?jī)蓚€(gè)同義詞集間的路徑長(zhǎng)短,值得范圍是0到1。路徑越長(zhǎng),值越小;路徑越短,值越大。兩者之間沒(méi)有路徑時(shí)返回-1,與自身比較時(shí)返回1。
wn.synset('car.n.01').path_similarity(wn.synset('car.n.02'))?
轉(zhuǎn)載于:https://www.cnblogs.com/yucen/p/9343548.html
總結(jié)
以上是生活随笔為你收集整理的NLPPython笔记——WordNet的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 成都欢乐谷付了钱是不是全都可以玩
- 下一篇: python函数使用易错举例