日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取西刺代理的免费IP

發布時間:2023/12/10 编程问答 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬取西刺代理的免费IP 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

背景

  • 出于爬取其他項目的需求,爬取點代理ip存成文本文件,隨機取一個簡單驗證,方便自己其他代碼里面調用。

環境

  • win10, python 3.6, pycharm

干貨

import requests from bs4 import BeautifulSoup import time import randomheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'}def xici_ip(page):for num_page in range(1,page+1):url_part = "http://www.xicidaili.com/wn/" # 爬取西刺代理的IP,此處選的是國內httpsurl = url_part + str(num_page) # 構建爬取的頁面URLr = requests.get(url, headers=headers)if r.status_code == 200:soup = BeautifulSoup(r.text,'lxml')trs = soup.find_all('tr')for i in range(1,len(trs)):tr = trs[i]tds = tr.find_all('td')ip_item = tds[1].text + ':' + tds[2].text# print('抓取第'+ str(page) + '頁第' + str(i) +'個:' + ip_item)with open(r'路徑\get_xici_ip.txt', 'a', encoding='utf-8') as f:f.writelines(ip_item + '\n')# time.sleep(1)return ('存儲成功')def get_ip():with open(r'路徑\get_xici_ip.txt', 'r', encoding='utf-8') as f:lines = f.readlines()return random.choice(lines)def check_ip():proxies = {'HTTPS': 'HTTPS://' + get_ip().replace('\n', '')}try:r = requests.get('http://httpbin.org/ip', headers=headers, proxies=proxies, timeout=10)if r.status_code == 200:return proxiesexcept Exception as e:print(e)def main():xici_ip(1) # 抓取第一頁,一頁100個urltry:return check_ip()except Exception as e:print(e)check_ip()if __name__ == '__main__':main()

參考

  • https://blog.csdn.net/luanpeng825485697/article/details/78698489
  • https://www.cnblogs.com/demon89/p/7223027.html
  • https://blog.csdn.net/oscer2016/article/details/75000148

End

走過路過,有任何問題,請不吝賜教。

總結

以上是生活随笔為你收集整理的爬取西刺代理的免费IP的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。