python使用get和post方法_python爬虫中get和post方法介绍以及cookie作用
首先確定你要爬取的目標(biāo)網(wǎng)站的表單提交方式,可以通過(guò)開(kāi)發(fā)者工具看到。這里推薦使用chrome。
這里我用163郵箱為例
打開(kāi)工具后再Network中,在Name選中想要了解的網(wǎng)站,右側(cè)headers里的request method就是提交方式。status如果是200表示成功訪問(wèn)下面的有頭信息,cookie是你登錄之后產(chǎn)生的存儲(chǔ)會(huì)話(session)信息的。第一次訪問(wèn)該網(wǎng)頁(yè)需要提供用戶名和密碼,之后只需要在headers里提供cookie就可以登陸進(jìn)去。
引入requests庫(kù),會(huì)提供get和post的方法。
代碼示例:
import requests
import ssl
user_agent="Mozilla/5.0 (Windows NT 10.0; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0"
accept='text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8'
accept_language='zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3'
upgrade='1'
headers={
'User-Agent':user_agent,
'Accept':accept,
'Accept-Language':accept_language,
'Cookie':'....'#這里填入你登陸后產(chǎn)生的cookie
}
r = requests.get("http://mail.163.com/js6/main.jsp?sid=OAwUtGgglzEJoANLHPggrsKKAhsyheAT&df=mail163_letter#module=welcome.WelcomeModule%7C%7B%7D",headers=headers,verify=False)
fp = open("/temp/csdn.txt","w",encoding='utf-8')
fp.write(str(r.content,'utf-8'))
fp.close()
這里我引入了ssl庫(kù),因?yàn)槲业谝淮卧L問(wèn)的網(wǎng)頁(yè)證書(shū)過(guò)期。如果我們使用爬蟲(chóng)進(jìn)入這樣的網(wǎng)站時(shí),會(huì)報(bào)錯(cuò):SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:581)
在requests的get和post方法中,有一個(gè)參數(shù)為verify,把他設(shè)為False后會(huì)禁掉證書(shū)的要求
本文標(biāo)題: python爬蟲(chóng)中g(shù)et和post方法介紹以及cookie作用
本文地址: http://www.cppcns.com/jiaoben/python/220258.html
總結(jié)
以上是生活随笔為你收集整理的python使用get和post方法_python爬虫中get和post方法介绍以及cookie作用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 好友号好好盗下载安装(好友号好好盗下载)
- 下一篇: python 排列组合_python解决