日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python爬关键词百度指数_利用python+selenium_phantomjs批量获取百度指数 第一步 分析...

發布時間:2023/12/16 python 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬关键词百度指数_利用python+selenium_phantomjs批量获取百度指数 第一步 分析... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、找到百度指數對應的數據

1.1、

1.2、

1.3、

結論:毛文本都找不著啊。根本就找不著根于百度指數數字相關的任何文本。

但是在style中找著了一個這個

將這個字符串與index.baidu.com拼起來,放進瀏覽器。會得到一個下載圖片,這個圖片打開來是這個樣子滴。

可以看到這張圖片中包含了相對應的百度指數中的數字。

只不過,百度通過加密,以style-css的形式,顯示出相對應的"圖片形"的數字。

從這個角度來看.想要從百度加密原理的方式來"破解"指數,是比較困難的。

二、

其困難有二、

2.1、沒有辦法確切的知道這套加密方式,可能百度有幾套加密方法,可能刷新一次,加密方式就換了一種。(我試過,刷新過后,背景圖片和css都換了。)所以“破解”這種加密方式是及其困難的。

2.2、在以后執行過程中,如果百度增加了加密方式,或者更換了加密方式,就徹底“懵逼”。

三、

那我們能不能嘗試另外一種方式來采集百度指數呢?

當時是有的,只不過稍微“笨”一些。

思路

3.1、像人一樣打開瀏覽器

3.2、像人一樣打開相應的百度指數的頁面

3.3、讓機器定位百度指數的x,y坐標

3.4、截屏

3.5、在截圖中找到第3.3部記錄下來的坐標。截小圖

3.6、識別圖中的數字

這里只貼了一個主文件。全部代碼請見我的公眾號“爬蟲張小呆”

有代碼經驗的同學請見我的github:

https://github.com/plus0318/BaiduIndex

總結

以上是生活随笔為你收集整理的python爬关键词百度指数_利用python+selenium_phantomjs批量获取百度指数 第一步 分析...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。