python北京房价预测_python数据分析——北京房价分析
數據集及源代碼鏈接:https://github.com/roberpan/python/tree/master/test/dataanalyse/houseprice
一、統計北京各區二手房單價排名,并分析高端小區(排名前10/50/100的小區),各區占有量
# -*- coding: utf-8 -*-
# 根據安居客數據來源,對二手房信息進行統計
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.read_csv('data/anjuke.csv')
get_region = lambda x: x.split('-')[0]
address = data['Region'].apply(get_region)
data['District'] = address
data['Unit_price'] = data['Price'] / data['Size']
plt.figure(figsize=(12,8)) #設置畫布大小
grid=plt.GridSpec(2,3) #劃分畫布,這樣可以調節每個子圖的大小
#繪制北京各行政區房價排名
fig1=plt.subplot(grid[0,0:3])
datagroup1 = data.groupby(['District'], as_index=False)
unit_price_mean=datagroup1.Unit_price.mean().sort_values(by='Unit_price',ascending=False)
sns.barplot(x='District',y='Unit_price',data=unit_price_mean)
plt.suptitle('北京各行政區房價排名')
#繪制總價排前列小區中,各個行政區的擁有量
datagroup2 = data.groupby(['District','Garden'], as_index=False)
price_mean = datagroup2.Price.mean()
price_mean = price_mean.sort_values(by='Price', ascending=False)
max_data1 = price_mean[:10]
max_data2 = price_mean[:50]
max_data3 = price_mean[:100]
sns.set()
fig2=plt.subplot(grid[1,0])
sns.countplot(x='District', data=max_data1).set_title('總價排名前10小區各行政區占有量')
fig3=plt.subplot(grid[1,1])
sns.countplot(x='District', data=max_data2).set_title('總價排名前50小區各行政區占有量')
fig4=plt.subplot(grid[1,2])
sns.countplot(x='District', data=max_data3).set_title('總價排名前100小區各行政區占有量')
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.show()
以上執行結果如下圖所示:
從以上結果可以看出:
1、從二手房單價維度看:西城最高,東城和海淀分別列第二、第三名,最低的區縣是平谷
2、從二手房總價排名前列的小區看:朝陽區遙遙領先,海淀、西城、順義也排名較為靠前
以上結果可以說明:
1、西城、東城、海淀單價高,應該與此三個區學區較好、較多有關,與地理位置也有一定關系,但學區影響應該遠大于地理位置影響,因為朝陽區、豐臺區位置都靠近市中心,但價格不明顯
2、朝陽區應該是富人最多的區域,再加上地理位置加成,其豪宅小區基本上占整個北京豪宅小區的一半以上,這也與朝陽區商業發達高度相關。另外比較意外的有兩個:一個是順義區豪宅小區也較多,應該與其擁有多個別墅小區、以及靠近朝陽區有關系;二是東城區豪宅數量很少(前100名豪宅小區數還不如昌平,跟大興差不多),應該與東城小區老舊,單個二手房面積小有關系
二、顯示北京二手房單價排名前十小區
# -*- coding: utf-8 -*-
# 根據安居客數據來源,對二手房信息進行統計
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.read_csv('data/anjuke.csv')
get_region = lambda x: x.split('-')[0]
address = data['Region'].apply(get_region)
data['District'] = address
data['Unit_price'] = data['Price'] / data['Size']
gardengp=data.groupby('Garden',as_index=False)
gardenmean=gardengp.Unit_price.mean().sort_values(by='Unit_price',ascending=False)
sns.barplot(x='Garden',y='Unit_price',data=gardenmean[:10],palette='Spectral_r')
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.show()
顯示結果如下:
總結
以上是生活随笔為你收集整理的python北京房价预测_python数据分析——北京房价分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: dex文件格式二
- 下一篇: websocket python爬虫_p