日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

selenium 翻页_利用selenium实现自动翻页爬取某鱼数据

發(fā)布時(shí)間:2024/1/23 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 selenium 翻页_利用selenium实现自动翻页爬取某鱼数据 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

基本思路:

首先用開(kāi)發(fā)者工具找到需要提取數(shù)據(jù)的標(biāo)簽列表:

利用xpath定位需要提取數(shù)據(jù)的列表

然后再逐個(gè)提取相應(yīng)的數(shù)據(jù):

保存數(shù)據(jù)到csv:

利用開(kāi)發(fā)者工具找到下一頁(yè)按鈕所在標(biāo)簽:

利用xpath提取此標(biāo)簽對(duì)象并返回:

調(diào)用點(diǎn)擊事件,并循環(huán)上述過(guò)程:

最終效果圖:

代碼:

from selenium import webdriver
import time
import re

class Douyu(object):

def __init__(self):
# 開(kāi)始時(shí)的url
self.start_url = "https://www.douyu.com/directory/all"
# 實(shí)例化一個(gè)Chrome對(duì)象
self.driver = webdriver.Chrome()
# 用來(lái)寫csv文件的標(biāo)題
self.start_csv = True

def __del__(self):
self.driver.quit()

def get_content(self):
# 先讓程序兩秒,保證頁(yè)面所有內(nèi)容都可以加載出來(lái)
time.sleep(2)
item = {}
# 獲取進(jìn)入下一頁(yè)的標(biāo)簽
next_page = self.driver.find_element_by_xpath("//span[text()='下一頁(yè)']/..")
# 獲取用于判斷是否是最后一頁(yè)的屬性
is_next_url = next_page.get_attribute("aria-disabled")
# 獲取存儲(chǔ)信息的所有l(wèi)i標(biāo)簽的列表
li_list = self.driver.find_elements_by_xpath("//ul[@class='layout-Cover-list']//li")

# 提取需要的數(shù)據(jù)
for li in li_list:

item["user-id"] = li.find_element_by_xpath(".//div[@class='DyListCover-userName']").text
item["img"] = li.find_element_by_xpath(".//div[@class='DyListCover-imgWrap']//img").get_attribute("src")
item['class-name'] = li.find_element_by_xpath(".//span[@class='DyListCover-zone']").text
item["click-hot"] = li.find_element_by_xpath(".//span[@class='DyListCover-hot']").text
item["click-hot"] = re.sub(r'\n','',item['click-hot'])

# 保存數(shù)據(jù)
self.save_csv(item)

# 返回是否有下一頁(yè)和下一頁(yè)的點(diǎn)擊事件的標(biāo)簽,
return next_page,is_next_url

def save_csv(self,item):
# 將提取存放到csv文件中的內(nèi)容連接為csv格式文件
str = ','.join([i for i in item.values()])

with open('./douyu.csv','a',encoding='utf-8') as f:
if self.start_csv:
f.write("用戶id,image,所屬類,點(diǎn)擊熱度\n")
self.start_csv = False
# 將字符串寫入csv文件
f.write(str)
f.write('\n')
print("save success")

def run(self):
# 啟動(dòng)chrome并定位到相應(yīng)頁(yè)面
self.driver.get(self.start_url)

while True:
# 開(kāi)始提取數(shù)據(jù),并獲取下一頁(yè)的元素
next_page,is_next = self.get_content()
if is_next!='false':
break
# 點(diǎn)擊下一頁(yè)
next_page.click()

if __name__=='__main__':
douyu_spider = Douyu()
douyu_spider.run()

歡迎關(guān)注公眾號(hào):Python爬蟲數(shù)據(jù)分析挖掘,回復(fù)【開(kāi)源源碼】免費(fèi)獲取更多開(kāi)源項(xiàng)目源碼

公眾號(hào)每日更新python知識(shí)和【免費(fèi)】工具

超強(qiáng)干貨來(lái)襲 云風(fēng)專訪:近40年碼齡,通宵達(dá)旦的技術(shù)人生

總結(jié)

以上是生活随笔為你收集整理的selenium 翻页_利用selenium实现自动翻页爬取某鱼数据的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 久久人妻免费视频 | 日韩乱码在线 | 国产精品久久久久久人妻精品动漫 | 日本一本久草 | 国产最新在线视频 | 波多野结衣乳巨码无在线 | 免费在线日本 | 成人免费视频网站在线观看 | 久久96 | 国产精品欧美激情在线 | 欧美一级免费 | 国产精品2019| 一本色道久久亚洲综合精品蜜桃 | 日韩av影片 | 男人把女人捅爽 | 黑人操中国女人视频 | 日韩免费av | 成人av软件| 国产美女视频一区 | 已满十八岁免费观看全集动漫 | 欧美黑人巨大xxx极品 | 亚洲大片免费观看 | 少妇高潮一区二区三区在线 | 日韩精品电影在线 | 久久涩 | 男女天堂av | 美女国产视频 | 精品欧美黑人一区二区三区 | 日本乱大交xxxx公交车 | 夫妻性生活黄色片 | 中文字幕免费在线观看视频 | 人妻久久久一区二区三区 | 九草在线观看 | 欧美一区二区在线观看 | 性午夜| 可以在线观看的av网站 | 日韩午夜高清 | av在线电影院 | 少妇又紧又色又爽又刺激视频 | 狂野欧美性猛交xxxxhd | 欧美黄色一级 | 伊人99re| 亚洲一区天堂 | 免费黄网站在线看 | 日韩成人精品一区 | 免费大片黄在线观看视频网站 | 亚洲乱码国产乱码精品精剪 | 国产伦精品一区二区 | 91 久久 | 我们的2018在线观看免费高清 | 亚洲视屏一区 | 富婆如狼似虎找黑人老外 | 姐姐你真棒插曲快来救救我电影 | 日韩在线播放中文字幕 | 欧美一区二区三区黄色 | 播播开心激情网 | 久久亚州 | 国模少妇一区二区三区 | 与亲女洗澡时伦了毛片 | 国内精品卡一卡二卡三 | 午夜欧美日韩 | av电影网站在线观看 | 99r热| 黄色av网址在线 | 奴性女会所调教 | 亚洲自啪| 欧美一区二区三区色 | 姑娘第5集高清在线观看 | 久久久精品网站 | 91亚洲国产成人久久精品网站 | 久久久久亚洲色欲AV无码网站 | 国产免费一区视频观看免费 | 亚洲欧美另类激情 | 国产一区二区三区影院 | 亚洲综合在线五月 | xxx毛片| 人妻精品久久久久中文字幕 | 最新av免费观看 | 欧美国产日韩精品 | 精品国产乱码久久久人妻 | 97成人资源站 | 少妇 av | 99色在线| 日韩视频在线观看一区二区 | 亚洲奶汁xxxx哺乳期 | 免费在线精品视频 | 国产三级视频网站 | 91丨porny丨国产| 91九色成人 | 欧美大片在线观看 | 国产麻豆成人精品av | 国产中出视频 | 国产午夜一区二区 | 九九九久久久久 | 天天干夜夜玩 | 暴操白虎 | 国产卡一卡二卡三 | 久久精品日 | 成人在线不卡视频 |