日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

python爬虫cookie池 与ip绑定_Python爬虫防封ip的一些技巧

發(fā)布時(shí)間:2023/12/19 python 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬虫cookie池 与ip绑定_Python爬虫防封ip的一些技巧 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

在編寫(xiě)爬蟲(chóng)爬取數(shù)據(jù)的時(shí)候,因?yàn)楹芏嗑W(wǎng)站都有反爬蟲(chóng)措施,所以很容易被封IP,就不能繼續(xù)爬了。在爬取大數(shù)據(jù)量的數(shù)據(jù)時(shí)更是瑟瑟發(fā)抖,時(shí)刻擔(dān)心著下一秒IP可能就被封了。

本文就如何解決這個(gè)問(wèn)題總結(jié)出一些應(yīng)對(duì)措施,這些措施可以單獨(dú)使用,也可以同時(shí)使用,效果更好。

偽造User-Agent

在請(qǐng)求頭中把User-Agent設(shè)置成瀏覽器中的User-Agent,來(lái)偽造瀏覽器訪問(wèn)。比如:

headers ={'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'} resp = requests.get(url,headers = headers)

還可以先收集多種瀏覽器的User-Agent,每次發(fā)起請(qǐng)求時(shí)隨機(jī)從中選一個(gè)使用,可以進(jìn)一步提高安全性:

把上面隨機(jī)選擇一個(gè)User-Agent的代碼封裝成一個(gè)函數(shù):

在每次重復(fù)爬取之間設(shè)置一個(gè)隨機(jī)時(shí)間間隔

比如:

time.sleep(random.randint(0,3)) # 暫停0~3秒的整數(shù)秒,時(shí)間區(qū)間:[0,3]

或:

time.sleep(random.random()) # 暫停0~1秒,時(shí)間區(qū)間:[0,1)

偽造cookies

若從瀏覽器中可以正常訪問(wèn)一個(gè)頁(yè)面,則可以將瀏覽器中的cookies復(fù)制過(guò)來(lái)使用,比如:

注:用瀏覽器cookies發(fā)起請(qǐng)求后,如果請(qǐng)求頻率過(guò)于頻繁仍會(huì)被封IP,這時(shí)可以在瀏覽器上進(jìn)行相應(yīng)的手工驗(yàn)證(比如點(diǎn)擊驗(yàn)證圖片等),然后就可以繼續(xù)正常使用該cookies發(fā)起請(qǐng)求。

使用代理

可以換著用多個(gè)代理IP來(lái)進(jìn)行訪問(wèn),防止同一個(gè)IP發(fā)起過(guò)多請(qǐng)求而被封IP,比如:

附:GitHub上的一個(gè)"反反爬蟲(chóng)"項(xiàng)目

道高一尺魔高一丈,你有反爬蟲(chóng)措施,那我也有各種"反反爬蟲(chóng)"的措施,GitHub上就有一位大神專門(mén)整理了一個(gè)這樣的項(xiàng)目:Anti-Anti-Spider,鏈接地址為:github.com/luyishisi/An可以研究一下。

以上就是Python爬蟲(chóng)防封ip的一些技巧的詳細(xì)內(nèi)容,更多關(guān)于Python爬蟲(chóng)防封ip的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

總結(jié)

以上是生活随笔為你收集整理的python爬虫cookie池 与ip绑定_Python爬虫防封ip的一些技巧的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。