日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python爬虫入门教程石家庄链家租房数据抓取

發布時間:2025/4/14 python 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python爬虫入门教程石家庄链家租房数据抓取 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?

1. 寫在前面

這篇博客爬取了鏈家網的租房信息,爬取到的數據在后面的博客中可以作為一些數據分析的素材。
我們需要爬取的網址為:https://sjz.lianjia.com/zufang/

2. 分析網址

首先確定一下,哪些數據是我們需要的


?

可以看到,黃色框就是我們需要的數據。

接下來,確定一下翻頁規律

https://sjz.lianjia.com/zufang/pg1/ https://sjz.lianjia.com/zufang/pg2/ https://sjz.lianjia.com/zufang/pg3/ https://sjz.lianjia.com/zufang/pg4/ https://sjz.lianjia.com/zufang/pg5/ ... https://sjz.lianjia.com/zufang/pg80/

?

3. 解析網頁

有了分頁地址,就可以快速把鏈接拼接完畢,我們采用lxml模塊解析網頁源碼,獲取想要的數據。

本次編碼使用了一個新的模塊?fake_useragent?,這個模塊,可以隨機的去獲取一個UA(user-agent),模塊使用比較簡單,可以去百度百度就很多教程。

本篇博客主要使用的是調用一個隨機的UA

self._ua = UserAgent() self._headers = {"User-Agent": self._ua.random} # 調用一個隨機的UA

由于可以快速的把頁碼拼接出來,所以采用協程進行抓取,寫入csv文件采用的pandas模塊

from fake_useragent import UserAgent from lxml import etree import asyncio import aiohttp import pandas as pdclass LianjiaSpider(object):def __init__(self):self._ua = UserAgent()self._headers = {"User-Agent": self._ua.random}self._data = list()async def get(self,url):async with aiohttp.ClientSession() as session:try:async with session.get(url,headers=self._headers,timeout=3) as resp:if resp.status==200:result = await resp.text()return resultexcept Exception as e:print(e.args)async def parse_html(self):for page in range(1,77):url = "https://sjz.lianjia.com/zufang/pg{}/".format(page)print("正在爬取{}".format(url))html = await self.get(url) # 獲取網頁內容html = etree.HTML(html) # 解析網頁self.parse_page(html) # 匹配我們想要的數據print("正在存儲數據....")######################### 數據寫入data = pd.DataFrame(self._data)data.to_csv("鏈家網租房數據.csv", encoding='utf_8_sig') # 寫入文件######################### 數據寫入def run(self):loop = asyncio.get_event_loop()tasks = [asyncio.ensure_future(self.parse_html())]loop.run_until_complete(asyncio.wait(tasks))if __name__ == '__main__':l = LianjiaSpider()l.run()

?

上述代碼中缺少一個解析網頁的函數,我們接下來把他補全

def parse_page(self,html):info_panel = html.xpath("//div[@class='info-panel']")for info in info_panel:region = self.remove_space(info.xpath(".//span[@class='region']/text()"))zone = self.remove_space(info.xpath(".//span[@class='zone']/span/text()"))meters = self.remove_space(info.xpath(".//span[@class='meters']/text()"))where = self.remove_space(info.xpath(".//div[@class='where']/span[4]/text()"))con = info.xpath(".//div[@class='con']/text()")floor = con[0] # 樓層type = con[1] # 樣式 agent = info.xpath(".//div[@class='con']/a/text()")[0]has = info.xpath(".//div[@class='left agency']//text()")price = info.xpath(".//div[@class='price']/span/text()")[0]price_pre = info.xpath(".//div[@class='price-pre']/text()")[0]look_num = info.xpath(".//div[@class='square']//span[@class='num']/text()")[0]one_data = {"region":region,"zone":zone,"meters":meters,"where":where,"louceng":floor,"type":type,"xiaoshou":agent,"has":has,"price":price,"price_pre":price_pre,"num":look_num}self._data.append(one_data) # 添加數據

?

不一會,數據就爬取的差不多了。

轉載于:https://www.cnblogs.com/Anderson-An/p/10280304.html

總結

以上是生活随笔為你收集整理的Python爬虫入门教程石家庄链家租房数据抓取的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产成人久久77777精品 | 激情小说亚洲图片 | 特级av| 欧美日韩在线直播 | 自拍偷拍免费 | 亚洲激情视频在线观看 | 国产精品丝袜在线观看 | 久久9999久久免费精品国产 | 精品动漫一区二区三区在线观看 | 秋葵视频污 | 国产美女免费视频 | 亚洲综合图色40p | 青娱乐伊人| 尤物视频免费观看 | 日韩不卡av | 天干夜天干天天天爽视频 | 久久精品99久久 | 91福利在线免费观看 | 99热这里只有精品久久 | 久久久久久久久久久久电影 | 国产成人综合网 | 特级西西人体4444xxxx | 一级黄色性视频 | 四虎网址在线 | 国产精品国产精品国产专区蜜臀ah | 自拍偷拍第3页 | 伊人ab | 91综合国产 | 丰满大爆乳波霸奶 | 精品久久久久久久免费人妻 | 中文第一页 | 3d动漫精品h区xxxxx区 | 日本激情一区二区三区 | 青青草视频免费 | 91午夜剧场| 69精品视频 | 国产第一网站 | 国产91精品久久久久久久网曝门 | 精品久久久久久久中文字幕 | 黄色天堂| 在线播放a | 日韩免费片 | 五月婷婷丁香 | 国产男男gay体育生网站 | 免费网站观看www在线观 | 在线观看免费黄色小视频 | 99re6这里只有精品 | 成人一区二区三区仙踪林 | 亚洲AV成人无码精电影在线 | 中日韩av在线 | 久久国产精品一区二区三区 | 精品人妻一区二区色欲产成人 | 天海翼一区二区 | 在线观看成人网 | 校园春色亚洲 | 亚洲色图 一区二区 | 天天干天天添 | 红桃成人在线 | 无遮挡毛片 | 天天燥日日燥 | 国产一级片自拍 | 精品一区二区三区免费看 | 国产精品美女久久久久久久 | 欧美大片视频在线观看 | 翔田千里88av中文字幕 | 91老司机在线| av导航网站 | 男生操女生网站 | 四虎激情 | 痴汉电车在线播放 | 久久都是精品 | 青青伊人国产 | 九色视频在线观看 | 日韩av中文字幕在线免费观看 | 山外人精品影院 | 色网网站 | 国产重口老太伦 | china国产乱xxxxx绿帽 | 久草a在线| 国产在线观看第一页 | 亚洲欧美另类日本 | 欧美特级黄色录像 | 69精品人妻一区二区三区 | 久久久久久久久久久久久久久久久 | 欧美成人一级视频 | 男人的天堂2018 | 亚州av在线播放 | 久久影音| 永久免费精品影视网站 | 一区二区日韩精品 | 蘑菇福利视频一区播放 | 黄色片免费在线播放 | 久久网免费视频 | 成人毛片av | 污片网站在线观看 | 日本啪啪片 | 91视频综合 | 女生张开腿给男生桶 | porn亚洲 |