python爬虫之图片
生活随笔
收集整理的這篇文章主要介紹了
python爬虫之图片
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
# -*- coding: utf-8 -*-
# feimengjuan
#
# re模塊主要包含了正則表達(dá)式
import re#urllib.request模塊提供了讀取Web頁面數(shù)據(jù)的接口
import urllib.request#抓取網(wǎng)頁圖片#根據(jù)給定的網(wǎng)址來獲取網(wǎng)頁詳細(xì)信息,得到的html就是網(wǎng)頁的源代碼
def getHtml(url):page = urllib.request.urlopen(url) # urllib.request.urlopen()方法用于打開了一個(gè)URL地址html = page.read().decode() # read().decode() 用于讀取URL上的數(shù)據(jù)并解碼return htmldef getImg(html):#利用正則表達(dá)式把源代碼中的圖片地址過濾出來reg = r'src="(.+?\.jpg)" pic_ext' # pic_ext=jpeg 用于正則匹配圖片格式imgre = re.compile(reg) # re.compile() 可以把正則表達(dá)式編譯成正則表達(dá)式對(duì)象,可以重復(fù)使用imglist = imgre.findall(html) #表示在整個(gè)網(wǎng)頁中過濾出所有圖片的地址,放在imglist中x = 0for imgurl in imglist:# urllib.request.urlretrieve()方法,直接將遠(yuǎn)程數(shù)據(jù)下載到本地,圖片通過x一次遞增命名urllib.request.urlretrieve(imgurl,'E:\haha\%s.jpg' %x) #打開imglist中保存的圖片網(wǎng)址,并下載圖片保存在本地x = x + 1print(imgurl)html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網(wǎng)址網(wǎng)頁詳細(xì)信息,得到的html就是網(wǎng)頁的源代碼
getImg(html)#從網(wǎng)頁源代碼中分析并下載保存圖片
總結(jié)
以上是生活随笔為你收集整理的python爬虫之图片的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UI标签库专题二:JEECG智能开发平台
- 下一篇: Python 学习记录1