Python爬虫学习(1)
生活随笔
收集整理的這篇文章主要介紹了
Python爬虫学习(1)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
使用Python爬取網(wǎng)頁中html內(nèi)容
# coding=utf-8
import urllib
import urllib2
import re
url = "http://3ms.huawei.com/km/blogs/details/5171043"
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
print html命令詳解:
urlopen()可以接收三個參數(shù)即urlopen(url, data, timeout)?
url即你要請求的url地址,data是訪問這個url需要傳送的數(shù)據(jù),timeout是超時時間?
url是必填參數(shù),其余兩個是可選參數(shù)?
urllib.request.urlopen(url)會返回一個http.client.HTTPResponse對象?
這個返回的對象可以使用read()方法,來返回數(shù)據(jù)
url即你要請求的url地址,data是訪問這個url需要傳送的數(shù)據(jù),timeout是超時時間?
url是必填參數(shù),其余兩個是可選參數(shù)?
urllib.request.urlopen(url)會返回一個http.client.HTTPResponse對象?
這個返回的對象可以使用read()方法,來返回數(shù)據(jù)
總結(jié)
以上是生活随笔為你收集整理的Python爬虫学习(1)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python中文问题 或 SyntaxE
- 下一篇: Python中read()、readli