日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python 词云手把手_手把手教你用python制作属于你的第一个词云

發布時間:2024/8/1 python 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python 词云手把手_手把手教你用python制作属于你的第一个词云 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

相信很多人在網上,或者是在一些報告或者ppt上,都看到過類似這種圖片

你可能會好奇它是怎么做出來的,如果你會ps,你可能會覺得,這是用ps一步一步制作出來的。是的沒錯,一開始我也是堅定不移的這么認為。直到后面我遇到了python。

上網搜索“如何制作詞云”,你會得到很多教程。但是這些教程都是利用了一些制作工具,它們功能都太過專一,適用范圍有限。而且它們背后的原理,無非也就是利用了python。今天,我們就拋開表面直擊本質。利用強大的python語言制作屬于自己的第一張詞云。(快放開我,我要裝逼)

眾所周知,python是目前大數據和人工智能領域最流行的語言,這其中很大一部分都要歸功于它強大的社區和數不清的第三方類庫,那有沒有一個集成環境同時集成了python語言的開發環境和常用的類庫呢,答案是肯定的,那就是Anaconda,它集成了大部分科學計算,數據處理,計算機繪圖等領域所用到的庫。

還有一件很有意思的事情,Anaconda和python的中文意思,都是蟒蛇。

好,接下來進入正題,一步一步實現我們的第一張詞云。

第一步:下載并安裝Anaconda

首先,進入官網,選擇適合你電腦的版本,

注意,無論你的電腦是什么系統,在右邊都會有兩個選項: Python 2.7 version和Python 3.6 version

我推薦下載使用python3.6版本,因為在這個最新的版本中,很多python語言的缺陷都得到了很好的解決(比如長期困擾python程序員的編碼問題),這樣在日后的學習中,我們都會進行的比較順利。

下載完成后得到一個exe格式的安裝文件,和正常軟件的安裝一樣,一直下一步下一步就行了,但是在這一步要注意,

一定要記得把第一個選項勾上,如果不勾上,在后續的環境變量配置問題上會比較麻煩。雖然它不建議這么做(說實話我也不知道為什么),安裝時間會比較久,耐心等待就行了。

安裝好了以后,先新建一個demo目錄,為了方便起見,我們直接在桌面新建。按住Shift鍵同時點擊鼠標右鍵,再點擊在此處打開命令窗口(win10較新的版本里cmd被powershell取代了,所以出現的會是在此處打開powershell窗口,別擔心,它們的功能是一樣的),然后輸入mkdir demo

然后在桌面上就會出現一個demo文件夾

然后在這里下載wordcloud工具包,

之前我們下的是python3.6的版本,如果你的電腦是32位的,就選中倒數第二個,如果是64位的,就選擇最后一個。

下載后將這個.whl文件拖拽到你的demo文件夾里。然后在命令行下,先執行

pip install wheel

再執行

pip install wordcloud-1.3.1-cp36-cp36m-win_amd64.whl

wordcloud-1.3.1-cp36-cp36m-win_amd64.whl就是你的下載下來的文件名,

這些步驟做完,我們就完成了運行環境配置。

第二步:開始分析

先找到你要分析的文章,將其保存為txt文件,比如我在網上摘取了一篇關于anaconda的介紹,將其保存為anaconda.txt文件,

然后在demo目錄下運行命令行jupyter notebook,打開jupyter編輯器。

很快瀏覽器就會被打開,跳轉到這個界面

點擊右上方的New,新建一個python3,然后瀏覽器就會打開一個新的頁面,用于輸入python代碼。

輸入

filename = "anaconda.txt"

with open(filename) as f:

mytext = f.read()

按Shift+Enter 執行,注意:第三行mytext前面一定要有空格。

再輸入mytext,按Shift+Enter運行,就會看到txt里的文本已經被保存到這個變量里面來了。

然后調用我們的wordcloud包,對mytext里面存儲的文本進行詞云分析。

from wordcloud import WordCloud

wordcloud = WordCloud().generate(mytext)

程序可能會報警,但是不會影響正常運行,直接忽略它就是了。

此時詞云分析已經完成了,最后一步對分析結果進行可視化處理。

%pylab inline

import matplotlib.pyplot as plt

plt.imshow(wordcloud, interpolation='bilinear')

plt.axis("off"

奇跡發生了

我們可以在圖片上右鍵將其保存到本地。

到這里,一張詞云就做好了。

wordcloud最核心的功能是對關鍵詞進行分析,出現頻率大的詞會用更大的字體對其進行顯示,除此之外,我們還可以自定義字體的顏色和詞云的形狀,圖片的分辨率等等等等。但是我們如果要對中文進行分析,還必須要借助中文分詞技術。這里就不再贅述。

作者:changes

總結

以上是生活随笔為你收集整理的python 词云手把手_手把手教你用python制作属于你的第一个词云的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。