日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python娃娃_充气娃娃?Python告诉你到底有多爽......

發布時間:2025/3/19 python 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python娃娃_充气娃娃?Python告诉你到底有多爽...... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

上某東的時候,突然給我彈了一個充氣娃娃的廣告,于是就點進去就看了一下評論,全是神評論啊。所以我就想著把大神們的評論們扒拉下來仔細瞅瞅,于是這篇文章就誕生了 ,純屬學習啊,不要想入非非啊,還有,不喜勿噴!

按照軟件設計流程來:

需求分析-功能描述-技術文檔-詳細設計-編碼-測試-交付-驗收-后期維護

1.需求分析:

首先我先找了某東最火娃娃,里面評論近乎7萬條,這里面神評論一定不少。所以決定從這個里面扒拉我們想要獲取的數據

2.功能描述充氣娃娃這種東西,一般大家都在網上見得多,所以玩起來到底感覺怎么樣。大家有可能知道,但是我不知道 。所以我只能分析一下大伙的使用感受。這次我將獲取到的數據統計以詞云的方式呈現。這樣呈現的數據比傳統的統計圖更直觀且更有藝術感。

3.技術文檔

1.使用requests獲取某東上的所有評論;

2.使用jieba將獲取到的評論切割成單個詞語,為詞云做鋪墊;

3.使用wordcloud生成詞云圖用以展示數據。

4.詳細設計

如上圖所示,首先我們F12或者右鍵打開開發者模式,然后找到Network下面的All,然后隨便復制一句評論在下面ctrl+F復制搜索。找到這句評論所在的位置。

找到評論的我所在位置之后,點擊左邊的Headers,如圖上所示的Request URL就是我們所要爬取所有評論的link。

5.編碼

找到評論所在的link之后,我們就可以上手coding了。評論有近七萬條,每頁只有十條評論,所以就是說有近七千多頁。但是不要慌,我們先爬取一頁數據看看,只要這一頁成功了,剩下的頁數問題都不大。

首先使用requests獲取數據(requests的不會用的童鞋可自行百度哈)

但是,似乎,but沒有拿到數據,什么鬼!

分析之后,確定是少了什么東西,首先我們來看看瀏覽器。

發現了嗎?

就是少了這個Refer和UserAgent,回到代碼繼續完善。。。

可以看到接入Refer和UserAgent之后已經拿到了我們想要爬取的數據。

但是這個json格式的數據看起來怪怪的,怪在哪里呢?前面多了這些fetchJSON_comment98vv7990(,后面多了);

所以我們首先要去掉這些對我們無益的東西來拿到正確的json數據

通過改良,拿到了我們想要的數據。但是我們想要的只是評論啊,這里怎么還有好多評論之外的東西呢?我們返回瀏覽器繼續查看

通過對比發現我們要的評論是在comments下面的content里面,按照這個邏輯,我們首先要進入到comments里面,然后在comments里面遍歷出所有的content。

然后將數據保存我們命名的jd_comments.txt文件中。(本來獲取到的數據是要放在數據庫里面的,咱們在這里將它放入txt文檔是為了后面詞云的使用)

對比一下,看寫入到file里面的內容與我們想要爬取的內容是否一致

接下來似乎單頁內容的爬取已經大功告成了,現在我們舉一反三來試試多頁評論的爬取。

首先我們按照上面的步驟再次復制一段評論

然后通過同樣的方法找出它的link對它們進行對比

對比發現除了它們的page不一樣之外其余都是一樣的。

也就是說它的分頁是按照pagesize = 10 的每頁十條記錄和page = 0,1,2,3,。。。進行分頁顯示的。

每頁十條記錄顯示是不變的,變的是不斷遞增的page,所以我們要把這個page設置為一個變量,讓他循環增加。

這里說明一下

對get_spider_comments方法加入變量page,當我們指定page的值時,它就可以獲取固定頁面的評論。

在batch_spider_comments方法中sleep方法,用來模擬用戶瀏覽,防止因為爬取太頻繁導致ip被封。

首先我們爬取了100頁的數據,可以看到爬取了984行。證明我們的多頁爬取也是沒有問題的。

為了更加直觀方便的看出評論的內容,我們決定使用詞云來進行展示。

首先需要我們對jieba和wordcloud進行了解,使用pip install jieba對jieba庫進行安裝。然后用jieba對獲取到的評論進行分詞。

然后使用pip install wordcloud再安裝wordcloud。最后用generate方法生成詞云圖。

說明一下,默認生成的詞云圖是正方形的,但是我在這里引入了imageio的 imread方法 以獲取原始圖片ball.jpg的參數

然后使用mask=mask 傳遞形狀參數,所以最后我們獲取到的就是一張圓形的詞云圖

所以之后大家可以按照自己的意愿來設置圖片的形狀。

希望大家可以參考學習,共同進步!!

總結

以上是生活随笔為你收集整理的python娃娃_充气娃娃?Python告诉你到底有多爽......的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 亚洲日本视频 | 国产aⅴ激情无码久久久无码 | 夜夜嗨av色一区二区不卡 | 精品伦精品一区二区三区视频密桃 | 欧美一区二区三区视频在线 | 欧美精品99| 人人狠狠综合久久亚洲 | 欧美日本国产 | 国产一级自拍 | 大陆日韩欧美 | 丰满少妇中文字幕 | 午夜免费激情视频 | 国产乱码一区 | 少妇av| 蜜桃传媒一区二区亚洲 | 深夜福利一区 | 国产一区二区自拍视频 | 97国产成人 | 久久精品国产一区二区三区 | 精品国产免费观看 | 肉体粗喘娇吟国产91 | 天堂在线1 | 91精品在线免费 | 亚洲v国产v欧美v久久久久久 | www.国产在线视频 | 麻豆精品国产精华精华液好用吗 | 人妖一区 | 色乱码一区二区三在线看 | 黄色网在线 | xx69欧美| 99干99| 国产亚洲精品码 | 亚洲精品一区二区三区蜜桃 | 久久中文字幕在线观看 | 96精品视频在线观看 | 肥老熟妇伦子伦456视频 | 国产超碰人人模人人爽人人添 | 欧美美女在线观看 | 中文幕无线码中文字蜜桃 | 欧美中文字幕在线观看 | 久久99精品久久久久久三级 | 欧美调教视频 | 欧美成人黑人xx视频免费观看 | 亚洲一区 | 很色的网站 | 怡红院一区二区三区 | 丝袜制服影音先锋 | 中国性老太hd大全69 | 久久精品国产免费看久久精品 | 亚洲色图88 | 亚洲aa| 男人喷出精子视频 | 国产精品27p| 国产精品久久9 | 国产又粗又猛又爽又黄的视频一 | 一本之道高清无码视频 | 91天堂网| 亚洲视频不卡 | 免费在线日本 | 伊人狼人综合 | 国产理论片 | 美女黄污网站 | 秋霞成人午夜鲁丝一区二区三区 | 五月激情丁香婷婷 | 四虎黄色网| 国产高潮失禁喷水爽到抽搐 | 老司机精品导航 | 午夜视频在线观看视频 | 黄色大片免费的 | 不卡一区二区在线 | 午夜三级在线 | 婷婷导航 | 亚洲一区二区三区高清视频 | 欧美精品免费一区二区 | 欧美一区二区国产 | 在线视频二区 | 自拍偷拍亚洲一区 | 国产综合图片 | 一级大片网站 | 麻豆精品视频免费观看 | 国产成人主播 | 成人在线免费观看网址 | 欧美精品乱码久久久久久按摩 | 素人女裸体| av毛片在线看 | 国产又粗又猛又色 | 琪琪免费视频 | 日韩色资源 | 国产99久久九九精品无码免费 | 伊人青青草原 | 日本一区二区在线看 | 天天爽天天操 | 久久亚洲天堂 | 成年人久久 | 亚洲九九色 | 色无极亚洲影院 | 久草新在线 | 无码人妻丰满熟妇区bbbbxxxx | 日韩电影在线观看一区 |