日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

day 01 python爬虫原理

發布時間:2025/3/20 python 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 day 01 python爬虫原理 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
# 今日內容:爬蟲原理
# 爬蟲課程:
# 實訓要求:
# 一 課下寫作業
# 二 編寫博客


# 一 爬蟲基本原理
# 1 什么是爬蟲
# 爬蟲就是爬數據
# 2 是什么互聯網
# 3 互聯網建立的目的
# 數據的傳遞與數據的共享
# 4 什么是數據
# 電商平臺的商品信息(淘寶,京東,亞馬遜)
# 鏈家,自如(租房平臺的房源信息)
# 股票證券投資信息(東方財富)
# 5 什么是上網
# 普通用戶:
# 打開瀏覽器--->輸入網址
# --->往目標主機發送請求
# 爬蟲三部曲
# 爬取校花視屏網
# 一 請求url
# 二 請求方式
# 三 請求頭信息
import requests
# 1,發送請求
def get_page(url):
response =requests.get(url)
return response

# 2,解析數據
import re
def parse_index(html):
# findall匹配所有
# re.findall('正則匹配規則','匹配文本','匹配模式')
# re.S(對全部文本進行搜索匹配)
detail_urls=re.findall('<div class="items"><a class="imglink" href="(.*?)"',html,re.S)
print(detail_urls)
# for detail_url in detail_urls:
# print(detail_url)
return detail_urls
# 解析詳情頁
def parse_detail(html):
movie_url=re.findall('<source src="(.*?)">',html,re.S)
print(movie_url)
# print(movie_url)
if movie_url:
return movie_url[0]
# 3,保存數據
# import uuid
# # uuid.uuid4()根據時間戳生成一段世界上唯一的字符串
# def save_video(content):
# with open(f'{uuid.uuid4()}.mp4','wb') as f:
# f.write(content)
# print('視頻下載完畢。。。請客人觀賞!!!')
# 測試用例
if __name__ == '__main__':
for line in range(6):
url = f'http://www.xiaohuar.com/List-3-{line}.html'

# 發送請求
response=get_page(url)
# print(response)
# 返回響應狀態碼
# print(response.status_code)
# 返回響應文本
# print(response.text)
# 解析主頁頁面
detail_urls=parse_index(response.text)
# 循環遍歷詳情頁 url
for detail_url in detail_urls:
# print(detail_url)
# 往每一個詳情頁發送請求
detail_res=get_page(detail_url)
# print(response.text)
# 解析詳情頁獲取視頻url
# print(detail_res)
movie_url=parse_detail(detail_res.text)
# 判斷視頻url存在則打印
if movie_url:
print(movie_url)
# 往視頻url發送請求獲取視頻二進制流
  movie_res=get_page(movie_url)
# 把視頻的二進制流傳給save——video的函數取保存到本地
save_video(movie_res.content)







# post請求自動登錄github
# 請求url
# https://github.com/session
# 請求方式
# post
# 請求頭
# Cookie
# 請求體
# commit: Sign in
# utf8: ?
# authenticity_token: <input type="hidden" name="authenticity_token" value="" />
# login: qweqwe
# password: qweqweqw
# webauthn-support: supported
# 1,訪問登陸頁面獲取token隨機字符串
# 請求url
# https://github.com/login
# 請求方式
# get
# 請求頭
# COOKIES
# Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36
# 2,解析并提取token字符串
# 正則
# <input type="hidden" name="authenticity_token" value="" />
import requests
import re
login_url='https://github.com/login'
# login頁面的請求頭信息
login_header={
'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
login_res=requests.get(url=login_url,headers=login_header)
# print(login_res.text)
# 解析提取token字符串
authenticity_token = re.findall(
'<input type="hidden" name="authenticity_token" value="(.*?)" />',
login_res.text,
re.S
)[0]
print(authenticity_token)
# 獲取login頁面的cookie信息
# print(type(login_res.cookies.get_dict()))
login_cookie=login_res.cookies.get_dict()
# session登錄url
session_url='https://github.com/session'
# 請求頭信息
session_header={
'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
# 請求體信息
form_data={
"commit": "Sign in",
"utf8": "?",
"authenticity_token":authenticity_token,
"login": "RuiZinb",
"password": "Pig,1574140397",
"webauthn-support": "supported"

}
session_res=requests.post(url=session_url,
headers=session_header,
cookies=login_cookie,
data=form_data
)
with open('github3.html','w',encoding='utf-8')as f:
f.write(session_res.text)

轉載于:https://www.cnblogs.com/RuiZi/p/11114023.html

總結

以上是生活随笔為你收集整理的day 01 python爬虫原理的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 中文字幕人妻一区二区三区视频 | 中文字幕亚洲欧美日韩 | 欧美国产二区 | 欧美激情在线观看视频 | 中文字幕免费 | 少妇精品视频 | 亚洲精品6| 国产农村妇女精品 | 成人一区视频 | 成人免费一级视频 | 女人色极品影院 | 337p粉嫩大胆色噜噜狠狠图片 | 精品欧美一区二区三区久久久 | 日韩国产精品一区二区 | 一女被多男玩喷潮视频 | 国产区一区二 | 国产男男gay体育生网站 | 国产乱仑视频 | 99视频导航| 国产精品久久久久久久裸模 | 91高清免费视频 | 亚洲黄色一区二区三区 | 日韩欧美99 | 国产麻豆a毛片 | 夜夜se| 大香蕉精品一区 | www.sesehu.com| 九一精品一区 | 成人动漫在线观看免费 | 欧美国产日韩视频 | 97视频在线观看免费高清完整版在线观看 | 欧美日韩在线成人 | 天堂va欧美va亚洲va老司机 | 欧美色激情 | 亚洲人成人 | a天堂在线 | 色涩色| 日韩av首页 | 日韩免费视频 | 欧美三级网站在线观看 | 国产资源视频 | 吃奶摸下的激烈视频 | 国产精品理论片在线观看 | 宅男午夜在线 | 欧美成人片在线 | 中国老太婆性做爰 | 少妇福利在线 | 四色永久访问 | av永久免费在线观看 | 天天做天天射 | 天天操天天射天天爱 | 亚洲第一在线视频 | www.浪潮av.com| 成年人免费大片 | 亚洲午夜一区二区 | 亚洲综合在线中文字幕 | 欧美日韩亚洲一区二区三区 | 向着小小的花蕾绽放 | 男男一级淫片免费播放 | 亚洲激情啪啪 | 高清视频一区二区 | 色播99| 韩国视频一区二区三区 | 天天天天色 | 精品乱子一区二区三区 | 福利在线观看 | 国产理伦 | 一本一道av无码中文字幕 | 成人精品自拍 | 日韩中文字幕视频在线 | 裸体一区二区三区 | 中文字幕一区二区三区人妻四季 | 日韩天堂在线视频 | 久草91| 欧美日韩激情视频在线观看 | 亚洲无码一区二区三区 | 成人一区二区在线观看 | 日日日日日日 | 精品国产大片大片大片 | 欧美极品在线观看 | 野花av| 欧美成人aaa片一区国产精品 | 国产精品1区 | av片大全 | 农村村妇真实偷人视频 | 丰满少妇被猛烈进入高清播放 | 久久人人妻人人人人妻性色av | 日本美女裸体视频 | 免费看一级黄色大全 | 久色成人 | 爱视频福利网 | 激情免费av | 成人h动漫精品一区二区器材 | 草草影院第一页 | 欧美视频一区二区三区在线观看 | 人妻熟女一区二区三区app下载 | 久久色av | 日韩一级 | 精品在线视频一区 |