日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

建方公寓挂牌房源信息爬取

發布時間:2024/3/24 编程问答 55 豆豆
生活随笔 收集整理的這篇文章主要介紹了 建方公寓挂牌房源信息爬取 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

爬取建方公寓掛牌房源信息

  • 背景
  • 完整代碼
  • 后話

背景

自從青客公寓分城市掛牌房源和優客逸家掛牌房源爬取之后,發現爬蟲也挺有趣的,于是今天又拿建方公寓練手,差點栽跟頭了,且聽我慢慢道來。有前兩次爬蟲經驗,發現在爬取青客設計的半自動邏輯較好,所以這次采用了只要輸入城市名稱和城市代碼以及總網頁數3個參數然后再執行程序,發現自己挺喜歡這種互動式的模式,有參與感,但是打印整個解析網頁的時候總提示我沒找到我要找到的東西,經過一番折騰,發現是請求頭出問題了,最初只構造了一個User-Agent, 很可能別人家服務器識別為爬蟲程序,于是在網頁源碼Network下面把headers原原本本寫下來

header={"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3","Accept-Encoding": "gzip, deflate","Accept-Language": "zh-CN,zh;q=0.9","Cache-Control": "max-age=0","Connection": "keep-alive","Cookie": "_site_id_cookie=1; clientlanguage=zh_CN; SESSION=62a74a27387f4f4a9ca7cf4e45768631; _cookie_city_name=%E5%B9%BF%E5%B7%9E","Host": "www.giantfind.com.cn","Upgrade-Insecure-Requests": "1","User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36"} #構造請求頭

修改之后打印整個解析網頁,發現要找的東西都出來,再也沒有提示沒找到我要找到的東西,心情瞬間大好,完整代碼如下

完整代碼

# -*- coding: utf-8 -*- """ project_name:giantfind @author: 帥帥de三叔 Created on Tue Aug 6 09:21:11 2019 """ import requests #導入請求模塊 from bs4 import BeautifulSoup #導入網頁解析模塊 import urllib.parse #url中文編碼 import re #導入正則模塊 import pymysql #導入數據庫功能模塊 import time #導入時間模塊 host="http://www.giantfind.com.cn" #主域名 header={"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3","Accept-Encoding": "gzip, deflate","Accept-Language": "zh-CN,zh;q=0.9","Cache-Control": "max-age=0","Connection": "keep-alive","Cookie": "_site_id_cookie=1; clientlanguage=zh_CN; SESSION=62a74a27387f4f4a9ca7cf4e45768631; _cookie_city_name=%E5%B9%BF%E5%B7%9E","Host": "www.giantfind.com.cn","Upgrade-Insecure-Requests": "1","User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36"} #構造請求頭print("connecting mysql……\n") db=pymysql.connect("localhost","root","123456","giantfind",charset='utf8') #鏈接數據庫 print("connect successfully\n") cursor=db.cursor() #獲取游標 cursor.execute("drop table if exists giantfind_gz\n") #重新創建表print("start creating table giantfind_gz") c_sql="""CREATE TABLE giantfind_gz(district varchar(8),title varchar(20),area varchar(6),price varchar(6),house_type varchar(6),floor varchar(6),towards_or_style varchar(4),address varchar(30) )Engine=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=UTF8""" cursor.execute(c_sql) print("table giantfind_gz has been created,please insert into data\n")def generate_page(page_num,city,cityCode): #定義生成總網頁數url="http://www.giantfind.com.cn/findRoomPc/index_{}.jhtml?city={}&cityCode={}&reservationChannel=21"for next_page in range(1,int(page_num)+1): yield url.format(next_page,city,cityCode,next_page)def get_detail_item(generate_page): #定義獲取詳情頁網址#print("網址是:",generate_page)response=requests.get(generate_page,headers=header) #發出請求time.sleep(1) #掛起進程1秒soup=BeautifulSoup(response.text,'lxml') #解析網頁detail_list=soup.find("div","content").find("div",class_="list-life list-lifen").findAll("a",class_="list-la list-lb stat") #該頁所有房源列表#print(len(detail_list))for content in detail_list:detail_url=host+content['href'] #構造詳情頁answer=requests.get(detail_url,headers=header) #進入詳情頁answer_json=BeautifulSoup(answer.text,'lxml') #解析詳情頁district=answer_json.find("div",class_="hos-csho").find("p").get_text().replace("建方·家","").replace("建方·寓","").strip() #區域title=answer_json.find("div",class_="hos-csho").find("h2").find("span").get_text() #房源名稱area=answer_json.find("div",class_="hos-csho").find("ul",class_="hos-clist").findAll("li")[0].find("i").find("span").get_text().split(" ")[1].replace("㎡","") #居住面積house_type=answer_json.find("div",class_="hos-csho").find("ul",class_="hos-clist").findAll("li")[0].find("i").find("span").get_text().split(" ")[0] #房型pattern_price=re.compile("\d+") #用以正則價格price=re.search(pattern_price,answer_json.find("div",class_="hos-csho").find("div").find("strong").get_text()).group(0) #價格floor=answer_json.find("div",class_="hos-csho").find("ul",class_="hos-clist").findAll("li")[1].find("i").get_text().replace("層","") #樓層towards_or_style=answer_json.find("div",class_="hos-csho").find("ul",class_="hos-clist").findAll("li")[2].find("i").get_text().strip() #朝向address=answer_json.find("div",class_="hos-csho").find("ul",class_="hos-clist").findAll("li")[4].find("i").get_text().replace(">","").strip() #詳細地址print(district,title,area,price,house_type,floor,towards_or_style,address) #字段測試insert_data=("INSERT INTO giantfind_gz(district,title,area,price,house_type,floor,towards_or_style,address)""VALUES(%s,%s,%s,%s,%s,%s,%s,%s)") #控制插入格式gaintfind_data=([district,title,area,price,house_type,floor,towards_or_style,address]) #待插入數據cursor.execute(insert_data,gaintfind_data) #執行插入操作db.commit() #主動提交def main(): #定義一個主函數整合其他所有函數city=urllib.parse.quote(input("please input city name:")) #請輸入城市名稱并Unicode編碼cityCode=input("please input city code:") #請輸入城市代碼page_num=input("please input total pages num:")for page_link in generate_page(page_num,city,cityCode):#print(page_link)get_detail_item(page_link)if __name__=="__main__":main()

后話

謹以此篇記錄遇到的header請求頭問題,不做代碼解析,爬蟲僅作為交流,如有冒犯,請告知刪。

延申閱讀
青客公寓掛牌房源分城市爬取
優客逸家掛牌房源爬取

總結

以上是生活随笔為你收集整理的建方公寓挂牌房源信息爬取的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 桃色视频网 | 欧美日韩在线中文字幕 | 午夜影院91| 国产九九热视频 | www.xxx.日本 | 国产精品伦 | 久插网 | 天天射日日 | 免费黄色在线观看 | 精品免费久久久 | 亚洲精品在线观看免费 | 亚洲操图 | 久久人精品 | 日本人の夫妇交换 | 国内精品人妻无码久久久影院蜜桃 | 亚色91| 亚洲AV综合色区无码国产播放 | 欧美午夜一区 | 国产精品腿扒开做爽爽爽挤奶网站 | 女女高潮h冰块play失禁百合 | 97久久国产 | 欧美一级免费片 | 精品国产aⅴ一区二区三区东京热 | 很黄很污的视频 | 国产精品乱码一区二区 | 爱情岛论坛亚洲品质自拍 | 狠狠干狠狠操视频 | 欧美 国产 日本 | www.youjizz国产| 国产成人免费在线观看 | 国产视频手机在线观看 | 国产精品成人av久久 | 123成人网 | 三年中文在线观看中文版 | 成人日韩欧美 | 天天爽夜夜爽 | 免费在线黄色网址 | 男人午夜天堂 | 久操国产在线 | 日韩在线播放视频 | 亚洲综合一区中 | 久久88| 亚洲国产高清在线 | 国产成人精品一区二区三区网站观看 | 精品国产黄 | 波多野结衣免费看 | 中国少妇初尝黑人巨大 | 日韩欧美中文字幕一区二区 | 在线观看国产精品视频 | 懂色av一区二区夜夜嗨 | 一级空姐毛片 | 免费在线黄网 | av色片| 97精品人人a片免费看 | 玉丸(双性调教) | 国产欧美日韩精品区一区二污污污 | 黄色av大全| 在线中文字幕亚洲 | 日韩特黄毛片 | a级无遮挡超级高清-在线观看 | 奇米888一区二区三区 | 久久精品牌麻豆国产大山 | 99热偷拍| 91视频精选 | 美女高潮黄又色高清视频免费 | 亚洲成人免费 | 国产日韩欧美一区二区东京热 | 激情成人av | 中文字幕在线看片 | 欧美日韩在线成人 | 天天艹 | 六月丁香综合 | 欧美俄罗斯乱妇 | 国内av网 | 久久久久久久久久久福利 | а√天堂8资源中文在线 | 在线观看午夜视频 | 亚洲视频一区在线观看 | 初高中福利视频网站 | www.成人在线 | 伊人影片 | 啪啪自拍| 欧美性潮喷xxxxx免费视频看 | 日本久久99| 五月婷婷基地 | 国产精品2区 | 日本a在线免费观看 | 亚洲精品二区 | 一区av在线 | 美少妇av| 女人下面喷水视频 | 天堂av免费看 | 亚洲人女屁股眼交6 | 亚洲国产毛片 | 影院一区 | 成人网址在线观看 | 最近中文字幕在线观看 | 欧美激情免费在线观看 | wwwjizzzcom|