python 词云手把手_手把手教你用python制作属于你的第一个词云
相信很多人在網上,或者是在一些報告或者ppt上,都看到過類似這種圖片
你可能會好奇它是怎么做出來的,如果你會ps,你可能會覺得,這是用ps一步一步制作出來的。是的沒錯,一開始我也是堅定不移的這么認為。直到后面我遇到了python。
上網搜索“如何制作詞云”,你會得到很多教程。但是這些教程都是利用了一些制作工具,它們功能都太過專一,適用范圍有限。而且它們背后的原理,無非也就是利用了python。今天,我們就拋開表面直擊本質。利用強大的python語言制作屬于自己的第一張詞云。(快放開我,我要裝逼)
眾所周知,python是目前大數據和人工智能領域最流行的語言,這其中很大一部分都要歸功于它強大的社區和數不清的第三方類庫,那有沒有一個集成環境同時集成了python語言的開發環境和常用的類庫呢,答案是肯定的,那就是Anaconda,它集成了大部分科學計算,數據處理,計算機繪圖等領域所用到的庫。
還有一件很有意思的事情,Anaconda和python的中文意思,都是蟒蛇。
好,接下來進入正題,一步一步實現我們的第一張詞云。
第一步:下載并安裝Anaconda
首先,進入官網,選擇適合你電腦的版本,
注意,無論你的電腦是什么系統,在右邊都會有兩個選項: Python 2.7 version和Python 3.6 version
我推薦下載使用python3.6版本,因為在這個最新的版本中,很多python語言的缺陷都得到了很好的解決(比如長期困擾python程序員的編碼問題),這樣在日后的學習中,我們都會進行的比較順利。
下載完成后得到一個exe格式的安裝文件,和正常軟件的安裝一樣,一直下一步下一步就行了,但是在這一步要注意,
一定要記得把第一個選項勾上,如果不勾上,在后續的環境變量配置問題上會比較麻煩。雖然它不建議這么做(說實話我也不知道為什么),安裝時間會比較久,耐心等待就行了。
安裝好了以后,先新建一個demo目錄,為了方便起見,我們直接在桌面新建。按住Shift鍵同時點擊鼠標右鍵,再點擊在此處打開命令窗口(win10較新的版本里cmd被powershell取代了,所以出現的會是在此處打開powershell窗口,別擔心,它們的功能是一樣的),然后輸入mkdir demo
然后在桌面上就會出現一個demo文件夾
然后在這里下載wordcloud工具包,
之前我們下的是python3.6的版本,如果你的電腦是32位的,就選中倒數第二個,如果是64位的,就選擇最后一個。
下載后將這個.whl文件拖拽到你的demo文件夾里。然后在命令行下,先執行
pip install wheel
再執行
pip install wordcloud-1.3.1-cp36-cp36m-win_amd64.whl
wordcloud-1.3.1-cp36-cp36m-win_amd64.whl就是你的下載下來的文件名,
這些步驟做完,我們就完成了運行環境配置。
第二步:開始分析
先找到你要分析的文章,將其保存為txt文件,比如我在網上摘取了一篇關于anaconda的介紹,將其保存為anaconda.txt文件,
然后在demo目錄下運行命令行jupyter notebook,打開jupyter編輯器。
很快瀏覽器就會被打開,跳轉到這個界面
點擊右上方的New,新建一個python3,然后瀏覽器就會打開一個新的頁面,用于輸入python代碼。
輸入
filename = "anaconda.txt"
with open(filename) as f:
mytext = f.read()
按Shift+Enter 執行,注意:第三行mytext前面一定要有空格。
再輸入mytext,按Shift+Enter運行,就會看到txt里的文本已經被保存到這個變量里面來了。
然后調用我們的wordcloud包,對mytext里面存儲的文本進行詞云分析。
from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext)
程序可能會報警,但是不會影響正常運行,直接忽略它就是了。
此時詞云分析已經完成了,最后一步對分析結果進行可視化處理。
%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off"
奇跡發生了
我們可以在圖片上右鍵將其保存到本地。
到這里,一張詞云就做好了。
wordcloud最核心的功能是對關鍵詞進行分析,出現頻率大的詞會用更大的字體對其進行顯示,除此之外,我們還可以自定義字體的顏色和詞云的形狀,圖片的分辨率等等等等。但是我們如果要對中文進行分析,還必須要借助中文分詞技術。這里就不再贅述。
作者:changes
總結
以上是生活随笔為你收集整理的python 词云手把手_手把手教你用python制作属于你的第一个词云的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vector删除第i个元素_LeetCo
- 下一篇: python打开360浏览器_pytho