日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python谷歌网页爬虫_python爬虫入门01:教你在 Chrome 浏览器轻松抓包

發布時間:2025/3/15 python 13 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python谷歌网页爬虫_python爬虫入门01:教你在 Chrome 浏览器轻松抓包 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

通過

python爬蟲入門:什么是爬蟲,怎么玩爬蟲?

我們知道了什么是爬蟲

也知道了爬蟲的具體流程

那么在我們要對某個網站進行爬取的時候

要對其數據進行分析

就要知道應該怎么請求

就要知道獲取的數據是什么樣的

所以我們要學會怎么抓咪咪!

image

哦,不對。

我們要學會怎么數據抓包

雖然小饅頭也是包的一種

ok…anyway…

打開我們的 Chrome 瀏覽器

在這里 小帥b 提醒大家一句

盡量不要用國產瀏覽器

很多是有后門的

image

所以

Chrome 是首選!

ok,打開 Chrome 瀏覽器之后呢

我們隨便輸入一個網址吧

比如

image

營養跟不上?那就…

輸入一個人人都能上的網站

用力回車

一個熟悉的頁面顯示在你的面前

image

這個時候,你按下 F12

你可以看到彈出一個有點裝逼的窗口

image

這個玩意

正是我們想要的

可以看到

Element 標簽下對應的 HTML 代碼

其實就是這個網頁的代碼

我們可以在這里除了看看它的代碼之外

我們還可以修改一些東西

比如我把這個按鈕改成小帥b

image

按下回車

image

是不是瞬間逼格滿滿

哦,不好意思

今天不是要說怎么裝逼的

image

我們點擊 Network 這個標簽

然后刷新一下

可以看到有很多的請求

image

HTTP 的請求方式有好幾種

GET, POST, PUT, DELETE, HEAD, OPTIONS, TRACE

不過最常見的就是 GET 和 POST 請求

咱們就一一說道說道

接下來就是

學習 python 的正確姿勢

image

我們直接搜索「蒼老師」

然后我們就可以發現

有好多請求

image

這些都是 GET 請求

我們隨便點擊一個請求進去

image

可以看到我們的請求URL

在 ?后面的這些 jb 玩意兒

就是 GET 請求的參數

這些參數以「鍵值對」的形式實現

比如這里的

wd=%E8%8B%8D%E8%80%81%E5%B8%88

就是告訴百度

我們要查詢的是蒼老師相關的內容

這種方式的請求方式是最簡單的

所以以后我們在 Python 寫 GET 請求的時候

直接在 URL 后面加個 ?然后添加參數值就好了

比如

我要百度搜索波多野結衣

那么就是

不信你直接在瀏覽器這樣搜

是一毛一樣的

那么,啥是 POST 請求呢?

我們在做一些信息提交的時候

比如注冊,登錄

這時候我們做的就是 POST 請求

POST 的參數不會直接放在 URL 上

會以 Form 表單的形式將數據提交給服務器

我們來登錄一下百度

image

當我們點擊登錄的時候

就開始將我們的賬號密碼請求給百度服務器

可以看到我們請求了 login 這個接口

請求方法就是 POST

image

而我們的請求參數是以 Form 表單的方式提交的

image

拉到下面就可以看到

username 就是 xiaoshuaib

而密碼,就是被加密了的

這些都是 POST 參數

可以發現

GET請求把請求參數都暴露在URL上

而POST請求的參數放在request body 里面

POST請求方式還對密碼參數加了密

這樣就相對安全一些

ok

你已經了解請求方式了

接下來說說請求頭

image

當然說的不是上面這個 gou 頭哈

我們剛剛在訪問百度的時候

可以看到這個玩意

image

這個就是請求頭

Request Header

我們在做 HTTP 請求的時候

除了提交一些參數之外

我們還有定義一些 HTTP 請求的頭部信息

比如 Accept、Host、cookie、User-Agent等等

這些參數也是我們在做爬蟲要用到

通過這些信息,欺騙服務器,告訴它我們是正規請求

比如

我們可以在代碼里面設置 cookie 告訴服務器我們就是在這個瀏覽器請求的會話

User-Agent 告訴服務器我們是瀏覽器請求的

image

說完我們這邊的請求了

接著我們再說說服務器的響應

你一定遇到過 404 頁面吧

或者服務器錯誤返回個 502 吧

image

這些 404 啊,200啊,301啊,502啊

都是服務器的響應碼

一般服務器給我們返回 200

那就說明

我們成功請求了

image

image

再來說說響應頭

image

當我們請求成功之后

服務器會給我們返回響應碼之外

還有響應頭

這個頭主要是告訴我們數據以什么樣的形式展現

告訴我們cookie的設置

還有一個

就是響應體了

說白了,就是服務器返回給我們的數據

我們點擊 Response 就可以看到相關的數據了

image

看,這些就是服務器返回給我們的 HTML 源代碼

對于不同的請求

我們獲取到的數據是不一樣的

除了 HTML的,也有 JSON 的

圖片二進制數據等等

可以針對不同的情況

用不同的手段來解析這些數據

說到這里

想必你已經會在 Chrome 抓包了

所謂抓包

就是我們摸清了瀏覽器里面的套路

知道它是怎么搞的

那么通過我們的請求

GET 請求也好

POST 請求也罷

只要知道請求方式

只要知道請求參數

只要知道請求頭定義

只要知道怎么拿到返回的數據

這..

對我們來說

爬蟲還難么?

image

完了!

爽嗎?

Python學習交流群:556370268,這里有資源共享,技術解答,還有小編從最基礎的Python資料到項目實戰的學習資料都有整理,希望能幫助你更了解python,學習python。

總結

以上是生活随笔為你收集整理的python谷歌网页爬虫_python爬虫入门01:教你在 Chrome 浏览器轻松抓包的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美性福利 | 日韩国产中文字幕 | 亚洲乱色熟女一区二区三区 | 天堂а√在线中文在线鲁大师 | 韩国av电影在线观看 | 阿v免费在线观看 | 国产吃瓜黑料一区二区 | videos亚洲| 天天干狠狠爱 | 在线看国产精品 | 69亚洲乱人伦| 欧美性色视频 | 日韩在线视频一区二区三区 | 国产av电影一区 | 亚洲爱爱片 | av狠狠| 天天干天天干天天干天天 | 美女精品网站 | 日韩人妻精品一区二区三区 | 男ji大巴进入女人的视频 | 女人被狂躁c到高潮喷水电影 | 日韩无| 久久99精品国产麻豆91樱花 | 欧美激情成人网 | 久久精品大全 | 丰满人妻一区二区三区四区 | 国产精品第7页 | 伊人亚洲 | 亚洲一区二区高清视频 | 成人91在线 | 中文字幕亚洲精品 | 国产成人免费观看视频 | 操比视频网站 | 粉嫩av懂色av蜜臀av分享 | 四虎国产精品成人免费入口 | 欧美自拍视频 | 永久av在线免费观看 | 久久精品视频91 | 中文字幕一区二区在线播放 | 91爱爱影院| av中文天堂在线 | 久久久久九九九九 | 97精品视频在线观看 | 啪啪福利社 | 精品国产自在精品国产精小说 | 交做爰xxxⅹ性爽 | xxxx国产片 | 日韩 中文字幕 | 国产一区二区在 | 午夜影院男女 | 人妻少妇久久中文字幕 | 国产精品二区在线观看 | 91青青操| 在线成人中文字幕 | www.一区二区三区四区 | 国产成人自拍视频在线 | 免费在线看黄的网站 | 国产一区二区三区18 | 一区二区在线播放视频 | 在线亚洲色图 | 日韩欧美国产另类 | 国产精品91久久 | 美女流白浆视频 | 国产精品制服丝袜 | 又黄又湿的网站 | 福利在线网站 | 激情无码人妻又粗又大 | 成长快手短视频在线观看 | 老牛影视av老牛影视av | 日韩高清影院 | 伊人色av | 在线视频免费观看 | 视色影院 | 善良的少妇伦理bd中字 | 一级女性全黄久久生活片免费 | 亚洲免费激情视频 | 中文字幕av专区dvd | 91视频免费在线 | 婷婷色图 | 午夜在线| 暖暖成人免费视频 | 操小妹影院| 可以看的毛片 | 亚洲av鲁丝一区二区三区 | 最新中文字幕在线观看 | 亚洲hh| 三级在线免费 | 五月激情视频 | 玖玖视频 | 欧美在线免费视频 | 女女调教被c哭捆绑喷水百合 | 特级一级黄色片 | 最新日韩av | 国产福利精品一区 | 成人免费毛片网站 | 国产原创视频 | 涩涩999| 激情另类小说 | 久热精品在线观看 |