日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

python爬虫怎么挣钱_python爬虫19 | 爬虫遇到需要的登录的网站怎么办?用这3招轻松搞定!...

發(fā)布時(shí)間:2023/12/19 python 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬虫怎么挣钱_python爬虫19 | 爬虫遇到需要的登录的网站怎么办?用这3招轻松搞定!... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

你好

由于你是游客

無法查看本文

請(qǐng)你登錄再進(jìn)

謝謝合作

當(dāng)你在爬某些網(wǎng)站的時(shí)候

需要你登錄才可以獲取數(shù)據(jù)

咋整?

莫慌

小帥b把這幾招傳授給你

讓你以后從容應(yīng)對(duì)

那么

接下來就是

學(xué)習(xí) python 的正確姿勢(shì)

登錄的常見方法無非是這兩種

1、讓你輸入帳號(hào)和密碼登錄

2、讓你輸入帳號(hào)密碼+驗(yàn)證碼登錄

今天

小帥b先跟你說說第一種

需要驗(yàn)證碼的咱們下一篇再講

第一招

Cookie大法

你平常在上某個(gè)不為人知的網(wǎng)站的時(shí)候

是不是發(fā)現(xiàn)你只要登錄一次

就可以一直看到你想要的內(nèi)容

過了一陣子才需要再次登錄

這就是因?yàn)?Cookie 在做怪

簡(jiǎn)單來說

就是每一個(gè)使用這個(gè)網(wǎng)站的人

服務(wù)器都會(huì)給他一個(gè) Cookie

那么下次你再請(qǐng)求數(shù)據(jù)的時(shí)候

你順帶把這個(gè) Cookie 傳過去

服務(wù)器一看

誒,小伙子是老客戶啊

有登錄過

直接返回?cái)?shù)據(jù)給他吧

在服務(wù)中還可以設(shè)置 Cookie 的有效時(shí)間

也就是說

當(dāng)你下次攜帶一個(gè)過期了的 Cookie 給服務(wù)器的時(shí)候

服務(wù)器雖然知道你是老客戶

但是還是需要你重新再登錄一次

然后再給你一個(gè)有效的 Cookie

Cookie 的時(shí)長周期是服務(wù)器那邊定的

ok

了解了這一點(diǎn)之后

我們就來玩一下吧

我們以「逼乎」為例

https://biihu.cc/account/login/

輸入地址之后

按一下 F12

點(diǎn)擊 network 標(biāo)簽

然后登錄你的帳號(hào)

然后點(diǎn)擊其中一個(gè)

你就可以看到在 Request Headers 有你的 Cookie

有了 Cookie 之后

我們?cè)诖a中直接獲取我的個(gè)人信息

import requests ? headers = {# 假裝自己是瀏覽器'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/73.0.3683.75 Chrome/73.0.3683.75 Safari/537.36',# 把你剛剛拿到的Cookie塞進(jìn)來'Cookie': 'eda38d470a662ef3606390ac3b84b86f9; Hm_lvt_f1d3b035c559e31c390733e79e080736=1553503899; biihu__user_login=omvZVatKKSlcXbJGmXXew9BmqediJ4lzNoYGzLQjTR%2Fjw1wOz3o4lIacanmcNncX1PsRne5tXpE9r1sqrkdhAYQrugGVfaBICYp8BAQ7yBKnMpAwicq7pZgQ2pg38ZzFyEZVUvOvFHYj3cChZFEWqQ%3D%3D; Hm_lpvt_f1d3b035c559e31c390733e79e080736=1553505597', } ? session = requests.Session() response = session.get('https://biihu.cc/people/wistbean%E7%9C%9F%E7%89%B9%E4%B9%88%E5%B8%85', headers=headers) ? print(response.text)

運(yùn)行后可以發(fā)現(xiàn)不用登錄就可以直接拿到自己的個(gè)人信息了

<!DOCTYPE html> <html> <head> <meta content="text/html;charset=utf-8" http-equiv="Content-Type" /> <meta content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" name="viewport" /> <meta http-equiv="X-UA-Compatible" content="IE=edge,Chrome=1" /> <meta name="renderer" content="webkit" /> <title>小帥b真特么帥 的個(gè)人主頁 - 逼乎</title> <meta name="keywords" content="逼乎,問答,裝逼,逼乎網(wǎng)站" /> <meta name="description" content="逼乎 ,與世界分享你的裝逼技巧與見解" /> <base href="https://biihu.cc/" /><!--[if IE]></base><![endif]--> <link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/bootstrap.css" /> <link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/icon.css" /> <link href="https://biihu.cc/static/css/default/common.css?v=20180831" rel="stylesheet" type="text/css" /> <link href="https://biihu.cc/static/css/default/link.css?v=20180831" rel="stylesheet" type="text/css" /> <link href="https://biihu.cc/static/js/plug_module/style.css?v=20180831" rel="stylesheet" type="text/css" /> <link href="https://biihu.cc/static/css/default/user.css?v=20180831" rel="stylesheet" type="text/css" /> <link href="https://biihu.cc/static/css/mood/mood.css" rel="stylesheet" type="text/css" /> <script type="text/javascript">var _02AEC94D5CA08B39FC0E1F7CC220F9B4="a5359326797de302bfc9aa6302c001b8";var G_POST_HASH=_02AEC94D5CA08B39FC0E1F7CC220F9B4;var G_INDEX_SCRIPT = "";var G_SITE_NAME = "逼乎";var G_BASE_URL = "https://biihu.cc";var G_STATIC_URL = "https://biihu.cc/static";var G_UPLOAD_URL = "/uploads";var G_USER_ID = "188";var G_USER_NAME = "小帥b真特么帥";var G_UPLOAD_ENABLE = "Y";var G_UNREAD_NOTIFICATION = 0;var G_NOTIFICATION_INTERVAL = 100000;var G_CAN_CREATE_TOPIC = "1";var G_ADVANCED_EDITOR_ENABLE = "Y";var FILE_TYPES = "jpg,jpeg,png,gif,zip,doc,docx,rar,pdf,psd"; </script> <script src="https://biihu.cc/static/js/jquery.2.js?v=20180831" type="text/javascript"></script> ? ....

第二招

表單請(qǐng)求大法

很簡(jiǎn)單

就是通過抓包

獲取請(qǐng)求登錄的時(shí)候需要用到的用戶名密碼參數(shù)

然后以表單的形式請(qǐng)求服務(wù)器

如果你細(xì)心一點(diǎn)的話應(yīng)該會(huì)知道之前說過拉

具體在這

去看下

我就不多說了

python爬蟲03:那個(gè)叫做 Urllib 的庫讓我們的 python 假裝是瀏覽器

第三招

Selenium 自動(dòng)登錄法

你應(yīng)該看過這兩個(gè)

python爬蟲09 | 上來,自己動(dòng) !這就是 selenium 的牛逼之處

python爬蟲11 | 這次,將帶你爬取b站上的NBA形象大使蔡徐坤和他的球友們

看過的話

那么對(duì)于你來說

Selenium 自動(dòng)登錄也太 tm 簡(jiǎn)單了吧

獲取到兩個(gè)輸入框的元素

再獲取到登錄按鈕

往輸入框?qū)懩愕膸ぬ?hào)密碼

然后自動(dòng)點(diǎn)擊一下登錄

username = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "帳號(hào)的selector"))) password = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "密碼的selector"))) submit = WAIT.until(EC.element_to_be_clickable((By.XPATH, '按鈕的xpath'))) ? username.send_keys('你的帳號(hào)') password.send_keys('你的密碼') submit.click()

登錄完之后拿到 Cookie

cookies = webdriver.get_cookies()

有了 Cookie 你就可以拿到你想要的數(shù)據(jù)了

ok

以上這三招

希望對(duì)你有幫助

咱們下一篇說說驗(yàn)證碼相關(guān)

下回見

peace

帥b老仙

法力無邊

(你想約我么?)

點(diǎn)個(gè)zan

繼續(xù)發(fā)力

總結(jié)

以上是生活随笔為你收集整理的python爬虫怎么挣钱_python爬虫19 | 爬虫遇到需要的登录的网站怎么办?用这3招轻松搞定!...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。