爬虫之基于线程池异步抓取
生活随笔
收集整理的這篇文章主要介紹了
爬虫之基于线程池异步抓取
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
from multiprocessing.dummy import Pool #線程池模塊#必須只可以有一個參數
def my_requests(url):return requests.get(url=url,headers=headers).textstart = time.time()
urls = ['http://127.0.0.1:5000/bobo','http://127.0.0.1:5000/jay','http://127.0.0.1:5000/tom',
]pool = Pool(3)
#map:兩個參數
#參數1:自定義的函數,必須只可以有一個參數
#參數2:列表or字典
#map的作用就是讓參數1表示的自定義的函數異步處理參數2對應的列表或者字典中的元素
page_texes = pool.map(my_requests,urls)
print(page_texes)print(time.time()-start)
?
轉載于:https://www.cnblogs.com/songzhixue/p/11303823.html
總結
以上是生活随笔為你收集整理的爬虫之基于线程池异步抓取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Maven常用的构建命令
- 下一篇: 【搜索】$P1092$虫食算