當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

爬取西刺代理的免费IP

發(fā)布時(shí)間：2023/12/10 编程问答 25 豆豆

生活随笔收集整理的這篇文章主要介紹了爬取西刺代理的免费IP 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

背景

出于爬取其他項(xiàng)目的需求，爬取點(diǎn)代理ip存成文本文件，隨機(jī)取一個(gè)簡(jiǎn)單驗(yàn)證，方便自己其他代碼里面調(diào)用。

環(huán)境

win10, python 3.6, pycharm

干貨

import requests from bs4 import BeautifulSoup import time import randomheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'}def xici_ip(page):for num_page in range(1,page+1):url_part = "http://www.xicidaili.com/wn/" # 爬取西刺代理的IP，此處選的是國(guó)內(nèi)httpsurl = url_part + str(num_page) # 構(gòu)建爬取的頁(yè)面URLr = requests.get(url, headers=headers)if r.status_code == 200:soup = BeautifulSoup(r.text,'lxml')trs = soup.find_all('tr')for i in range(1,len(trs)):tr = trs[i]tds = tr.find_all('td')ip_item = tds[1].text + ':' + tds[2].text# print('抓取第'+ str(page) + '頁(yè)第' + str(i) +'個(gè)：' + ip_item)with open(r'路徑\get_xici_ip.txt', 'a', encoding='utf-8') as f:f.writelines(ip_item + '\n')# time.sleep(1)return ('存儲(chǔ)成功')def get_ip():with open(r'路徑\get_xici_ip.txt', 'r', encoding='utf-8') as f:lines = f.readlines()return random.choice(lines)def check_ip():proxies = {'HTTPS': 'HTTPS://' + get_ip().replace('\n', '')}try:r = requests.get('http://httpbin.org/ip', headers=headers, proxies=proxies, timeout=10)if r.status_code == 200:return proxiesexcept Exception as e:print(e)def main():xici_ip(1) # 抓取第一頁(yè)，一頁(yè)100個(gè)urltry:return check_ip()except Exception as e:print(e)check_ip()if __name__ == '__main__':main()

參考

https://blog.csdn.net/luanpeng825485697/article/details/78698489
https://www.cnblogs.com/demon89/p/7223027.html
https://blog.csdn.net/oscer2016/article/details/75000148

End

走過(guò)路過(guò)，有任何問(wèn)題，請(qǐng)不吝賜教。

總結(jié)

以上是生活随笔為你收集整理的爬取西刺代理的免费IP的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Android 平台电容式触摸屏的驱动基
下一篇：电路宽度测量halcon例子

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

爬取西刺代理的免费IP

背景

環(huán)境

干貨

參考

End

總結(jié)