日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

自然语言处理库——TextBlob

發布時間:2025/3/21 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 自然语言处理库——TextBlob 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

? ? ? ? TextBlob(https://textblob.readthedocs.io/en/dev/index.html)是一個用于處理文本數據的Python庫。它提供一個簡單的API,可用于深入研究常見的NLP任務,如詞性標注、名詞短語提取、情感分析、文本翻譯、分類等。

官方文檔:https://textblob.readthedocs.io/en/dev/

目錄

1. 情感分析

2.詞性標注

3.?分詞和分句

4.?名詞短語列表

5. 詞形還原及詞干提取

(1)單復數

(2)Word 類

(3)WordNet:獲取近義詞

6. 拼寫矯正

(1)直接矯正

(2)Word 拼寫檢查

7. 單詞詞頻

(1)單詞詞頻

(2)短語頻次

8.?翻譯及語言檢測語言


1. 情感分析

? ? ? ? 情感指的是隱藏在句子中的觀點,極性(polarity)定義句子中的消極性或積極性,主觀性(subjectivity)暗示句子的表達的含糊的、還是肯定的。

? ? ? ? 返回一個元組?Sentiment(polarity,?subjectivity).?

? ? ? ?polarity: [-1.0, 1.0].? ? ?-1.0 消極,1.0積極

? ? ? subjectivity: [0.0, 1.0]? ? ? 0.0 表示客觀,1.0表示主觀.

from textblob import TextBlobtext = "Textblob is amazingly simple to use. What great fun!" blob = TextBlob(text) # 創建一個textblob對象 from textblob import TextBlobresult = blob.sentiment # Sentiment(polarity=0.39166666666666666, subjectivity=0.4357142857142857)polarity = blob.sentiment.polarity # 0.39166666666666666

2.詞性標注

wiki = TextBlob("Python is a high-level, general-purpose programming language.") tag = wiki.tags# [('Python', 'NNP'), ('is', 'VBZ'), ('a', 'DT'), ('high-level', 'JJ'), ('general-purpose', 'JJ'), ('programming', 'NN'), ('language', 'NN')]

3.?分詞和分句

blob = TextBlob("Beautiful is better than ugly. ""Explicit is better than implicit. ""Simple is better than complex.")word = blob.words sentence = blob.sentences''' ['Beautiful', 'is', 'better', 'than', 'ugly', 'Explicit', 'is', 'better', 'than', 'implicit', 'Simple', 'is', 'better', 'than', 'complex'][Sentence("Beautiful is better than ugly."), Sentence("Explicit is better than implicit."), Sentence("Simple is better than complex.")] '''

4.?名詞短語列表

list = wiki.noun_phrases# ['python']

5. 詞形還原及詞干提取

(1)單復數

? ? ? ?singularize() 變單數, pluralize()變復數,用在對名詞進行處理,且會考慮特殊名詞單復數形式

sentence = TextBlob('Use 4 spaces per indentation level.') word = sentence.wordsdanshu = word[2].singularize() # space fushu = word[-1].pluralize() # levels

(2)Word 類

? ? ?lemmatize() 方法? 對單詞進行詞形還原名詞找單數,動詞找原型。所以需要一次處理名詞,一次處理動詞。

from textblob import Wordw1 = Word('apples') result1 = w1.lemmatize() # 默認只處理名詞 applew2 = Word('went') result2 = w2.lemmatize("v") # 對動詞原型處理 go

(3)WordNet:獲取近義詞

# 1.獲取近義詞 from textblob import Word from textblob.wordnet import VERB result1 = Word("hack").synsets result2 = Word("hack").get_synsets(pos=VERB) #get_synsets(): 只查找 該詞作為 動詞 的集合,參數為空時和synsets方法相同''' result1:[Synset('hack.n.01'), Synset('machine_politician.n.01'), Synset('hack.n.03'), Synset('hack.n.04'), Synset('cab.n.03'), Synset('hack.n.06'), Synset('hack.n.07'), Synset('hack.n.08'), Synset('chop.v.05'), Synset('hack.v.02'), Synset('hack.v.03'), Synset('hack.v.04'), Synset('hack.v.05'), Synset('hack.v.06'), Synset('hack.v.07'), Synset('hack.v.08')]result2:[Synset('chop.v.05'), Synset('hack.v.02'), Synset('hack.v.03'), Synset('hack.v.04'), Synset('hack.v.05'), Synset('hack.v.06'), Synset('hack.v.07'), Synset('hack.v.08')] '''2. 獲取近義詞的定義 defi = result1[1].definition() # 獲取定義#defi結果: a politician who belongs to a small clique that controls a political party for private rather than public ends3. 獲取單詞本身的定義 defi = Word("octopus").definitions# ['tentacles of octopus prepared as food', 'bottom-living cephalopod having a soft oval body with eight long tentacles']

6. 拼寫矯正

(1)直接矯正

b = TextBlob("I havv goood speling!") b_corr = b.correct() print(b_corr) # I have good spelling!

(2)Word 拼寫檢查

? ? ? word.spellcheck()方法,返回帶有拼寫建議的(word,confidence)元組列表

from textblob import Word w = Word('falibility') w_ = w.spellcheck() print(w_) # [('fallibility', 1.0)]

7. 單詞詞頻

(1)單詞詞頻

monty = TextBlob("We are no longer the Knights who say Ni. ""We are now the Knights who say Ekki ekki ekki PTANG.")#(1)方式1 counts = monty.word_counts['ekki'] # 不區分大小寫 print(counts) # 3 #(2)方式2 counts2 = monty.words.count('ekki') print(counts2) # 3#(3)方式3 counts3 = monty.words.count('ekki', case_sensitive=True) # 設置大小寫敏感,默認不區分 print(counts3) # 2

(2)短語頻次

counts4 = wiki.noun_phrases.count('python') # 短語頻次 print(counts4) # 1

8.?翻譯及語言檢測語言

en_blob = TextBlob('Simple is better than complex.') lang = en_blob.translate(to='es') # from_lang默認 en print(lang) # TextBlob("Simple es mejor que complejo.")chinese_blob = TextBlob("美麗優于丑陋") lang = chinese_blob.translate(from_lang="zh-CN", to='en') print(lang) # TextBlob("Beautiful is better than ugly")

?

總結

以上是生活随笔為你收集整理的自然语言处理库——TextBlob的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 一区二区三区中文字幕 | 欧美激情视频网址 | yy4138理论片动漫理论片 | 午夜成人免费电影 | 神马久久久久久久久久 | www.中文字幕av | 欧美另类极品 | 成人动漫免费在线观看 | 欧美日韩大片 | 欧美在线视频一区二区 | 91成人免费看 | 男女av网站 | 欧美久久免费 | 美腿丝袜亚洲综合 | 亚洲制服丝袜诱惑 | 超碰在线观看免费版 | 天堂影视在线观看 | 国产成人综合在线 | 天天综合久久综合 | 精品人妻无码一区二区三区换脸 | 91看片网 | 精品99在线观看 | 国精产品一区一区三区免费视频 | 国产成人在线视频网站 | 国产欧美一区二区三区免费看 | 亚洲性激情 | 亚洲精品在线视频免费观看 | 鲁一鲁啪一啪 | 一二级毛片 | 人妻夜夜爽天天爽 | 天天综合色网 | 最好看的日本字幕mv视频大全 | 国模叶桐尿喷337p人体 | 日韩欧美国产电影 | av资源导航| 婷婷射图 | 成人小视频在线观看 | 大乳村妇的性需求 | 大色av | 久久激情片 | 亚洲欧美韩日 | 成人app在线 | 日韩av免费在线看 | 国产每日更新 | 天天综合永久入口 | 天堂av观看 | 18视频在线观看网站 | 亚洲第一天堂影院 | 国产福利小视频在线观看 | 97超碰在线免费观看 | 黄色激情视频在线观看 | 合欢视频在线观看 | 999精品国产 | 免费在线欧美 | 日本一区二区免费电影 | 欧洲日韩一区二区三区 | 在线欧美视频 | 希岛婚前侵犯中文字幕在线 | 操人网 | 成人午夜视频精品一区 | 日韩一区中文 | 久久av免费观看 | 公侵犯人妻一区二区 | 97干视频 | 蜜臀在线视频 | 亚洲一区二区自拍 | 精品少妇人妻av免费久久洗澡 | 顶级毛片 | 日韩国产一区 | 伊人av影院 | 天天狠狠操 | 亚洲天堂中文字幕在线观看 | 欧美日韩国产三级 | 尤物在线免费视频 | 樱桃视频一区二区三区 | 69午夜| 国产男同gay网站 | 国产黑丝在线 | 男人把女人捅爽 | 成人av在线一区二区 | 综合色吧 | av免费网页 | 中文字幕成人在线视频 | 日韩美女网站 | 黄色草逼网站 | 日韩少妇诱惑 | 国产精品视频合集 | 成人免费毛片嘿嘿连载 | 黄视频网站在线 | 成人久久一区二区 | 91精品国产91久久久 | 久草综合视频 | 好吊色视频在线观看 | 亚洲一区视频在线播放 | 欧美综合在线视频 | 国产精彩视频 | 精品国产乱码久久久久 | 欧日韩不卡在线视频 | 黄色网络在线观看 |