日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python异步爬取知乎热榜

發布時間:2025/3/20 python 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python异步爬取知乎热榜 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、錯誤代碼:摘要和詳細的url獲取不到

import asyncio from bs4 import BeautifulSoup import aiohttpheaders={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36','referer': 'https://www.baidu.com/s?tn=02003390_43_hao_pg&isource=infinity&iname=baidu&itype=web&ie=utf-8&wd=%E7%9F%A5%E4%B9%8E%E7%83%AD%E6%A6%9C' } async def getPages(url):async with aiohttp.ClientSession(headers=headers) as session:async with session.get(url) as resp:print(resp.status) # 打印狀態碼html=await resp.text()soup=BeautifulSoup(html,'lxml')items=soup.select('.HotList-item')for item in items:title=item.select('.HotList-itemTitle')[0].texttry:abstract=item.select('.HotList-itemExcerpt')[0].textexcept:abstract='No Abstract'hot=item.select('.HotList-itemMetrics')[0].texttry:img=item.select('.HotList-itemImgContainer img')['src']except:img='No Img'print("{}\n{}\n{}".format(title,abstract,img))if __name__ == '__main__':url='https://www.zhihu.com/billboard'loop=asyncio.get_event_loop()loop.run_until_complete(getPages(url))loop.close()

二、查看JS代碼

發現詳細鏈接、圖片鏈接、問題摘要等都在JS里面(CSDN的開發者助手插件確實好用)

?

正則表達式獲取上述信息

?

接下來就是詳細的代碼啦

import asyncio import json import re import aiohttpheaders={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36','referer': 'https://www.baidu.com/s?tn=02003390_43_hao_pg&isource=infinity&iname=baidu&itype=web&ie=utf-8&wd=%E7%9F%A5%E4%B9%8E%E7%83%AD%E6%A6%9C' } async def getPages(url):async with aiohttp.ClientSession(headers=headers) as session:async with session.get(url) as resp:print(resp.status) # 打印狀態碼html=await resp.text()regex=re.compile('"hotList":(.*?),"guestFeeds":')text=regex.search(html).group(1)# print(json.loads(text)) # json換成字典格式for item in json.loads(text):title=item['target']['titleArea']['text']question=item['target']['excerptArea']['text']hot=item['target']['metricsArea']['text']link=item['target']['link']['url']img=item['target']['imageArea']['url']if not img:img='No Img'if not question:question='No Abstract'print("Title:{}\nPopular:{}\nQuestion:{}\nLink:{}\nImg:{}".format(title,hot,question,link,img))if __name__ == '__main__':url='https://www.zhihu.com/billboard'loop=asyncio.get_event_loop()loop.run_until_complete(getPages(url))loop.close()

?

?

總結

以上是生活随笔為你收集整理的Python异步爬取知乎热榜的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 最新欧美日韩 | 最近中文字幕在线mv视频在线 | 夜夜操夜夜操 | 91久久在线 | 亚洲日本中文字幕在线 | 福利一区二区在线观看 | 91爱爱.com | 成人免费看片又大又黄 | 日韩精品久久久久久 | 久久一区二区电影 | 91成人精品国产刺激国语对白 | 亚洲精品国产精品乱码不99 | 无码无套少妇毛多18pxxxx | 九九在线观看免费高清版 | 91资源站 | 首尔之春在线看 | 久久精品亚洲一区 | 日韩99 | 黄色的网站在线 | 91av麻豆| 蜜桃av成人永久免费 | 春色av| 亚洲一区二区三区高清 | 亚洲狠狠爱 | 国产夫绿帽单男3p精品视频 | 91精品国产乱码久久久久久久久 | av在线看片 | 五月天综合在线 | www.在线看 | 鲁丝片一区二区三区 | 肉色超薄丝袜脚交一区二区 | 国产在线一级片 | 黄片毛片在线看 | 激情小说一区 | 亚洲涩涩 | 日本一区二区免费看 | 伊人久久精品一区二区三区 | 曰批视频在线观看 | 九七伦理电影 | 国产成人精品免费网站 | 夜夜艹天天干 | 蜜臀久久99精品久久久久久宅男 | 国产精品免费网站 | 精品少妇视频 | 黄在线免费看 | 亚洲免费国产 | 另类国产 | 新婚若妻侵犯中文字幕 | 欧美aa级 | 青娱乐国产精品 | 亚洲精品乱码久久久久久 | 金鱼妻日剧免费观看完整版全集 | 黄页网站视频 | 污污内射久久一区二区欧美日韩 | 久久久久久久久久一区二区 | 91亚洲精品久久久蜜桃借种 | 国产亚洲毛片 | 国产一级自拍 | 中国三级黄色 | 国产成人高清在线 | 91激情网| 久久人人爽人人爽人人 | 性欧美又大又长又硬 | 视频久久 | 一区二区三区福利视频 | 国产午夜视频在线 | 亚洲精品18在线观看 | 国产91区 | 精品中文字幕在线 | 日韩福利一区二区 | 欧美理论在线观看 | jizz在线播放 | av成人资源 | 亚洲精品视频中文字幕 | 波多野结衣视频免费在线观看 | 天天在线免费视频 | 超碰caopor | 女人脱下裤子让男人捅 | 国产麻豆一级片 | 欧美亚洲另类在线 | 国产一级视频在线播放 | 亚洲91网 | 精品色图| 黑人操中国女人视频 | 天天想你免费观看完整版高清电影 | 午夜国产视频 | 91嫩草香蕉 | av动漫网| 欧美久操 | 亚洲再线| 国产91在线免费 | 欧美在线免费看 | 国产精品香蕉在线观看 | 久久视频一区二区三区 | 中文字幕久久久久久久 | 麻豆changesxxx国产 | 亚洲久久在线 | 一本一道久久a久久精品蜜桃 | 91麻豆精品国产理伦片在线观看 |