日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

查看list的形状_用Wordcloud生成指定形状的词云图

發(fā)布時(shí)間:2025/3/12 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 查看list的形状_用Wordcloud生成指定形状的词云图 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

wordcloud是Python擴(kuò)展庫中一種將詞語用圖片表達(dá)出來的一種形式,通過詞云生成的圖片,我們可以更加直觀的看出某篇文章的故事梗概。

首先貼出一張?jiān)~云圖(以哈利波特小說為例):

在生成詞云圖之前,首先要做一些準(zhǔn)備工作

1.安裝結(jié)巴分詞庫

pip install jieba

Python中的分詞模塊有很多,他們的功能也都是大同小異,我們安裝的結(jié)巴分詞?是當(dāng)前使用的最多的類型。

下面我來簡單介紹一下結(jié)巴分詞的用法

結(jié)巴分詞的分詞模式分為三種:

(1)全模式:把句子中所有的可以成詞的詞語都掃描出來, 速度快,但是不能解決歧義問題

(2)精確模式:將句子最精確地切開,適合文本分析

(3)搜索引擎模式:在精確模式的基礎(chǔ)上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞

下面用一個(gè)簡單的例子來看一下三種模式的分詞區(qū)別:

import jieba# 全模式:把句子中所有的可以成詞的詞語都掃描出來, 速度快,但是不能解決歧義問題text = "哈利波特是一常優(yōu)秀的文學(xué)作品"seg_list = jieba.cut(text, cut_all=True)print(u"[全模式]: ", "/ ".join(seg_list))# 精確模式:將句子最精確地切開,適合文本分析seg_list = jieba.cut(text, cut_all=False)print(u"[精確模式]: ", "/ ".join(seg_list))# 默認(rèn)是精確模式seg_list = jieba.cut(text)print(u"[默認(rèn)模式]: ", "/ ".join(seg_list))# 搜索引擎模式:在精確模式的基礎(chǔ)上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞seg_list = jieba.cut_for_search(text)print(u"[搜索引擎模式]: ", "/ ".join(seg_list))

下面是對這句話的分詞方式:

通過這三種分詞模式可以看出,這些分詞模式并沒有很好的劃分出“哈利波特”這個(gè)專有名詞,這是因?yàn)樵诮Y(jié)巴分詞的字典中并沒有記錄這個(gè)名詞,所以需要我們手動添加自定義字典。

添加自定義字典:找一個(gè)方便引用的位置(下圖的路徑是我安裝的位置),新建文本文檔(后綴名為.txt),將想添加的詞輸入進(jìn)去(注意輸入格式),保存并退出。

在上面的代碼中加入自定義字典的路徑,再點(diǎn)擊運(yùn)行。

jieba.load_userdict("/home/jmhao/anaconda3/lib/python3.7/site-packages/jieba/mydict.txt")

分詞結(jié)果,可以看出“哈利波特”這個(gè)詞已經(jīng)被識別出來了。

結(jié)巴分詞還有另一個(gè)禁用詞的輸出結(jié)果。

stopwords = {}.fromkeys(['優(yōu)秀', '文學(xué)作品'])#添加禁用詞之后seg_list = jieba.cut(text)final = ''for seg in seg_list:if seg not in stopwords:final += segseg_list_new = jieba.cut(final)print(u"[切割之后]: ", "/ ".join(seg_list_new))

可以看到輸出結(jié)果中并沒有“優(yōu)秀”和“文學(xué)作品”兩個(gè)詞

結(jié)巴分詞還有很多比較復(fù)雜的操作,具體的可以去官網(wǎng)查看,我就不再過多的贅述了。

下面我們正式開始詞云的制作。

首先下載模塊,這里我所使用的環(huán)境是Anaconda,由于Anaconda中包含很多常用的擴(kuò)展包,所以這里只需要下載wordcloud。若使用的環(huán)境不是Anaconda,則另需安裝numpy和PIL模塊。

pip install wordcloud

然后我們需要找一篇文章并使用結(jié)巴分詞將文章分成詞語的形式。

# 分詞模塊def cut(text):# 選擇分詞模式word_list = jieba.cut(text,cut_all= True)# 分詞后在單獨(dú)個(gè)體之間加上空格result = " ".join(word_list)# 返回分詞結(jié)果return result

這里我在當(dāng)前文件夾下創(chuàng)建了一個(gè)文本文檔“xiaoshuo.txt”,并復(fù)制了一章的小說作為詞云的主體文字。

使用代碼控制,打開并讀取小說的內(nèi)容

#導(dǎo)入文本文件,進(jìn)行分詞,制作詞云with open("xiaoshuo.txt") as fp:text = fp.read()# 將讀取的中文文檔進(jìn)行分詞text = cut(text)

在網(wǎng)上找到一張白色背景的圖片下載到當(dāng)前文件夾,作為詞云的背景圖(若不指定圖片,則默認(rèn)生成矩形詞云)

#設(shè)置詞云形狀,若設(shè)置了詞云的形狀,生成的詞云與圖片保持一致,后面設(shè)置的寬度和高度將默認(rèn)無效mask = np.array(image.open("monkey.jpeg"))

接下來可以根據(jù)喜好來定義詞云的顏色、輪廓等參數(shù) 下面為常用的參數(shù)設(shè)置方法

完整代碼

#導(dǎo)入詞云庫from wordcloud import WordCloud#導(dǎo)入圖像處理庫import PIL.Image as image#導(dǎo)入數(shù)據(jù)處理庫import numpy as np#導(dǎo)入結(jié)巴分詞庫import jieba# 分詞模塊def cut(text):# 選擇分詞模式word_list = jieba.cut(text,cut_all= True)# 分詞后在單獨(dú)個(gè)體之間加上空格result = " ".join(word_list)return result#導(dǎo)入文本文件,進(jìn)行分詞,制作詞云with open("xiaoshuo.txt") as fp:text = fp.read()# 將讀取的中文文檔進(jìn)行分詞text = cut(text)#設(shè)置詞云形狀mask = np.array(image.open("monkey.jpeg"))#自定義詞云wordcloud = WordCloud(# 遮罩層,除白色背景外,其余圖層全部繪制(之前設(shè)置的寬高無效)mask=mask,#默認(rèn)黑色背景,更改為白色background_color='#FFFFFF',#按照比例擴(kuò)大或縮小畫布scale=,# 若想生成中文字體,需添加中文字體路徑font_path="/usr/share/fonts/bb5828/逐浪雅宋體.otf").generate(text)#返回對象image_produce = wordcloud.to_image()#保存圖片wordcloud.to_file("new_wordcloud.jpg")#顯示圖像image_produce.show()

注:若想要生成圖片樣式的詞云圖,找到的圖片背景必須為白色,或者使用Photoshop摳圖替換成白色背景,否則生成的詞云為矩形

我的詞云原圖:

生成的詞云圖:

?

- END -

文源網(wǎng)絡(luò),僅供學(xué)習(xí)之用,如有侵權(quán),聯(lián)系刪除。往期精彩

◆ ?50款開源工具你都用過嗎?

◆ ?你知道Python的就業(yè)方向和薪資嗎?(贈學(xué)習(xí)資料)

◆ ?python網(wǎng)絡(luò)爬蟲的基本原理詳解

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)

總結(jié)

以上是生活随笔為你收集整理的查看list的形状_用Wordcloud生成指定形状的词云图的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 精品一区二区三区在线视频 | 90岁肥老奶奶毛毛外套 | 黄色美女视频网站 | jzzijzzij亚洲成熟少妇 | 亚洲综合狠狠 | 黄色在线资源 | 国产又粗又黄又爽的视频 | 久久久久网站 | 国产在线一区不卡 | 亚欧洲精品视频在线观看 | 亚洲精品影视 | 欧美成人免费播放 | 亚洲精品成a人 | 色爱综合网 | 国产伦理一区二区 | 日韩网红少妇无码视频香港 | 国产一区二区视频在线免费观看 | 吊侵犯の奶水授乳羞羞漫画 | 丰满人妻av一区二区三区 | 天天做天天躁天天躁 | 中文字幕精品久久 | 黑人与日本少妇高潮 | 丰满大爆乳波霸奶 | 欧美一区二区三区大屁股撅起来 | 亚洲国产aaa | 懂色aⅴ一区二区三区免费 国产精品99在线观看 | 中文字幕在线观看视频免费 | 亚洲av无码国产精品色午夜 | 久久久亚洲欧美 | 午夜精品久久 | 日本少妇激情视频 | 国产影视av | 欧美成人aa | 女人裸体免费网站 | av色婷婷 | 少妇媚药按摩中文字幕 | 精品无码国产av一区二区三区 | 可以免费观看av | 好吊妞视频一区二区三区 | 无码成人一区二区 | 国产三级成人 | 九九爱国产 | 天天看a | 她也啪在线视频 | 一本色道久久综合亚洲精品 | 亚洲精品少妇久久久久久 | 香蕉视频网址 | 歪歪视频在线观看 | 麻豆视频精品 | 午夜精品久久久久久99热 | 好吊妞在线 | 超碰超碰在线 | 国产精品制服丝袜 | 国产在线高潮 | 婷婷六月色 | 日韩电影一区二区在线观看 | 2025av在线播放 | 久久国产精品一区二区 | 国产精品久久久久久吹潮 | 九色av| 性中国古装videossex | 国产真人做爰毛片视频直播 | 久久精品噜噜噜成人88aⅴ | 免费看黄网站在线 | 国产毛片精品国产一区二区三区 | xx视频在线观看 | 黄色美女毛片 | 久久不卡免费视频 | 色男人网 | 午夜羞羞影院 | 波多野结衣久久 | 久久金品 | 一级黄色播放 | 日本黄色大片网站 | 伊人网五月天 | 久久人人干 | 校园激情亚洲 | 亚洲成人午夜在线 | 久久高清内射无套 | 国产区精品在线 | 欧美日韩一区二区三区视频 | 国产美女视频一区二区 | 色综合av综合无码综合网站 | 国产精品无码免费播放 | 黄色视屏软件 | 色汉综合 | 在线看片网址 | 伊人国产在线视频 | 国产色片 | 日韩女优网站 | 午夜天堂av| 香蕉网久久 | 天天操天天干天天摸 | 色呦呦在线视频 | 欧美一及片 | 成人区人妻精品一区 | 中文字幕成人动漫 | 啪啪日韩 | 丰满人妻一区二区三区精品高清 |