日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

Python WordCloud 文本分析 生成词云图

發(fā)布時(shí)間:2023/12/20 python 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python WordCloud 文本分析 生成词云图 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章目錄

    • 環(huán)境準(zhǔn)備
    • Code
    • 結(jié)果文件
    • Links

環(huán)境準(zhǔn)備

  • Python, pip安裝配置;

  • 安裝依賴(lài)的包(使用-i url指定要使用的鏡像源,加快下載速度)

pip install wordcloud scipy jieba

如果下載速度太慢,加參數(shù)-i https://pypi.tuna.tsinghua.edu.cn/simple使用國(guó)內(nèi)鏡像下載即可。

  • 文件準(zhǔn)備:
  • 要分析的文本文件(當(dāng)然也可以在代碼中直接寫(xiě)字符串)。
  • 中文字體文件(必須設(shè)置,否則中文詞云圖會(huì)顯示小方塊樣式的亂碼)
    可以在Windows系統(tǒng)中搜索.ttf結(jié)尾的,便是字體文件,我選的是simfang.ttf。
  • 背景文件
    默認(rèn)會(huì)生成矩形圖片(文字為彩色),如果想生成指定樣式的詞云(包括重設(shè)顏色),可以通過(guò)mask設(shè)置背景。
    我下載了:https://tse2-mm.cn.bing.net/th/id/OIP.D_Gm8IGCvkqmOgtU2hueVwHaHS?pid=Api&rs=1

Code

注意相對(duì)路徑和絕對(duì)路徑。

如果使用的相對(duì)路徑加載文件,執(zhí)行該py腳本的時(shí)候,應(yīng)該先cd到該腳本所在目錄,然后:

python test-wordcloud.py

test-wordcloud.py

from wordcloud import WordCloud, ImageColorGenerator, STOPWORDS import matplotlib.pyplot as plt import scipy.misc as imread import jieba# 要分析的文本文件的路徑 text_file_paths = "余華-活著.txt" # 自定義詞云背景圖片的路徑(可不設(shè)置) mask_file_path = "bg.jpg" # 中文字體路徑 font_path = "C:\Windows\WinSxS\amd64_microsoft-windows-font-truetype-simfang_31bf3856ad364e35_10.0.18362.1_none_5a7f93f39ed619f0\simfang.ttf" # 要生成的結(jié)果路徑 result_file_path = "result.jpg"mask_img = plt.imread(mask_file_path)with open(text_file_paths, "r", encoding="UTF-8") as f:text = f.read()wordlist_after_jieba = jieba.cut(text, cut_all=True) wl_space_split = " ".join(wordlist_after_jieba)wc = WordCloud(background_color="white",font_path=font_path,# mask=mask_img, # 是否自己指定的背景圖片prefer_horizontal=0.9, # 詞語(yǔ)水平展示的比例width=500,height=300,scale=10,max_words=500,relative_scaling=0.5,stopwords=STOPWORDS,max_font_size=70,collocations=False,min_word_length=2, ) wc.generate(wl_space_split)# 自定義圖片背景形狀、顏色 # image_colors = ImageColorGenerator(mask_img) # wc.recolor(color_func=image_colors)# 寫(xiě)入到圖片文件中 wc.to_file(result_file_path)# 顯示圖片 plt.imshow(wc) plt.axis("off") plt.show()

結(jié)果文件

  • 不配置中文字體文件,出現(xiàn)小方塊亂碼:

  • 配置中文字體后:

  • 自己指定背景圖片后(該圖片的寬高會(huì)覆蓋我們的給詞云的width height配置):

  • 自己指定圖片的顏色方案:

  • Links

    • WordCloud 參數(shù)詳細(xì)配置及釋義

    總結(jié)

    以上是生活随笔為你收集整理的Python WordCloud 文本分析 生成词云图的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。