Python词云学习之旅
生活随笔
收集整理的這篇文章主要介紹了
Python词云学习之旅
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言:
上次看知乎的時候,看到了一位python大神爬取了一些人們在疫情結束后第一件事要干嘛的評論,并做成了云圖,當時就覺得特別有意思,所以就來學習一下。
下載的話就不過多介紹了,百度上都有,主要說一下編輯云詞很好用的工具以及如何去制作詞云。
0x00:jupyter notebook工具
工具的介紹以及下載可以查知乎大神寫的
https://zhuanlan.zhihu.com/p/33105153
安裝好之后,更改一下默認目錄,之后運行的話只需輸入
即可運行
0x01:制作一個簡單的詞云
因為默認是無法加載漢字的,所以需要復制一下本地字體進行導入
復制一個到你設置的jupyter notebook目錄,導入即可
背景圖片
生成的詞云圖
但如果想要透明背景的話應該怎么做
去掉之后,再運行就OK了
這里我設置的字符串是
如果是這么長的一段話,又該怎么處理那?
text = "TheShy:首先第一個是個人認為薇恩打鐵男是一個很好的英雄之一。在玩鐵男的立場上,如果說不Ban薇恩的話,鐵男是很難玩的。因為薇恩也是沒有玩過這個英雄,所以當時也在猶豫到底要不要用這個英雄,但是當時隊友說可以用這個英雄,就拿薇恩了。"使用\進行分割
也可以導入一個第三方自然語言處理庫
空格、符號會被自動去掉,但是wcd.generate(text)需要傳入的是字符串不是列表,而且傳入的字符串需要每個字間隔都要有空格,可以改成如下的格式
這樣generate方法就可以進行處理了
這個只是一個最簡單的例子,之后會每天進行學習做一個不同的云圖!!!
未完待續!!!
總結
以上是生活随笔為你收集整理的Python词云学习之旅的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Centos7 LAMP服务源码搭建
- 下一篇: Python爬虫之旅_(数据解析)_正则