日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

中文文本情感分析-python包SnowNLP入门

發布時間:2025/4/5 python 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 中文文本情感分析-python包SnowNLP入门 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?

目錄

?

1.情感分析是什么?

2.情感分析有什么用?

3.情感分析實戰-SnowNLP

SnowNLP官方參考資料:

SnowNLP兩個坑:

自己用snownlp訓練模型:

?


1.情感分析是什么?

?

極性:觀點正負性的程度,0-1,0為負,1為正

持有者:提取出觀點的持有者是誰

日常分析中使用頻率:極性>觀點>持有者

?

?

程度詞設置不同的權重

從例子可以看出,基于情感詞典的分析是有誤差的

?

文本向量化:文本變為數值

?

2.情感分析有什么用?

?

3.情感分析實戰-SnowNLP

?

SnowNLP官方參考資料:

https://pypi.org/project/snownlp/

https://github.com/isnowfy/snownlp

SnowNLP介紹:是一個python寫的類庫,可以方便的處理中文文本內容,是受到了TextBlob的啟發而寫的,由于現在大部分的自然語言處理庫基本都是針對英文的,于是寫了一個方便處理中文的類庫,并且和TextBlob不同的是,這里沒有用NLTK,所有的算法都是自己實現的,并且自帶了一些訓練好的字典。注意本程序都是處理的unicode編碼,所以使用時請自行decodeunicode。

?

SnowNLP兩個坑:

SnowNLP已經訓練好的模型不支持中文繁體字和英文,因為訓練好的模型是用中文簡體訓練的

?

Snownlp模型訓練精度不高,比如:

?

?

自己用snownlp訓練模型:

官網中關于訓練的說明

現在提供訓練的包括分詞,詞性標注,情感分析,而且都提供了我用來訓練的原始文件 以分詞為例 分詞在snownlp/seg目錄下

from snownlp import seg

seg.train('data.txt')

seg.save('seg.marshal')

# from snownlp import tag

# tag.train('199801.txt')

# tag.save('tag.marshal')

# from snownlp import sentiment

# sentiment.train('neg.txt', 'pos.txt')

# sentiment.save('sentiment.marshal')

這樣訓練好的文件就存儲為seg.marshal了,之后修改snownlp/seg/__init__.py里的data_path指向剛訓練好的文件即可

?

?

?

總結

以上是生活随笔為你收集整理的中文文本情感分析-python包SnowNLP入门的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。