日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取斗图王图片

發布時間:2023/12/20 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬取斗图王图片 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
'''下方的庫使用前需要進行安裝操作 安裝方法: 1.打開 cmd(命令提示符)win10系統直接打開開始菜單,然后輸入cmd即可打開。 2.輸入 pip install requests 以此類推,一個個安裝。 下面第二行和第三行,安裝 bs4 和lxml ''' import requests from bs4 import BeautifulSoup from lxml import etree import re import os import time#函數為獲得需要爬取的頁面信息,并返回頁面信息 def gethtml(pagenum): #try...except...方法是避免爬取出錯導致程序終止。try:#start_url為初始URL,需要從這個地址中獲取圖片鏈接start_url = 'http://www.bbsnet.com/doutu/page/'url = start_url + str(pagenum)r = requests.get(url, timeout=10) #使用requests庫進行爬取,然后使用BeautifulSoup進行頁面解析,html = BeautifulSoup(r.text, 'lxml')print(r.status_code)except:print('gethtml')return html#獲取圖片鏈接 def parsepage(html):items = html.find_all(name='img',attrs={"width":"300","height":"200"})yield items#下載圖片 def downloader(ite, pagenum): #os庫的使用方法,本人博客中有詳細的介紹if not os.path.exists('C:\\Users\\Administrator\\Desktop\\python\\爬取的圖片'): #此處的路徑可以換成自己的文件路徑。os.mkdir('C:\\Users\\Administrator\\Desktop\\python\\爬取的圖片') #此段代碼的意思是如果此路徑下爬取的圖片這個文件夾不存在,則創建一個新的num=1for ul in ite:u=ul.get('src')s=requests.get(u)print(u)#進行打開文檔讀取或者寫入操作的時候建議使用with open (path)as f: 的方式,好處是不用考慮操作完成后的文件關閉。with open('C:\\Users\\Administrator\\Desktop\python\\爬取的圖片\\ 第{}頁第{}張.jpg'.format(pagenum,num), 'wb')as f:f.write(s.content)print('正在打印第{}頁{}張'.format(pagenum,num))num +=1#主函數,所有函數都在這里調用 def main(pagenum):html = gethtml(pagenum)for ite in parsepage(html):downloader(ite, pagenum)if __name__ == '__main__':for pagenum in range(18):main(pagenum)time.sleep(10)

這里是圖片截圖,只是單純的依照斗圖網上的頁面和順序對圖片進行命名。本人比較懶!!!

總結

以上是生活随笔為你收集整理的爬取斗图王图片的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。