pearsonr() python_Python 来算算一线城市的二手房价格指数相关性
Python中有很多方法計算相關性,scipy中有自帶的分析工具,pandas里也有非常方便的多變量相關性分析。我們今天就講講這兩個工具的用法。
1.數據收集
本文北上廣深的數據采集自東方財富網,以二手房價格指數為例:
數據從2011年1月1日開始,每個數據點是當時一個月的價格指數,采集方法是用開發者工具找到請求發回來的JSON數據,方法如下:
數據如下(2011/1/1-2019/10/1):
# 北京:2.準備工作
首先,你要確保你的電腦安裝了Python,如果沒有可以看這篇文章:超詳細安裝Python指南。
然后,打開CMD(開始-運行-cmd),或者Terminal(macOS) 輸入以下指令安裝scipy和pandas.
pip install scipy pip install pandas3.編寫代碼
3.1 scipy計算相關性
scipy計算相關性其實非常簡單,引入包的stats模塊:
import scipy.stats as stats然后調用函數進行計算:
# 計算廣州和深圳二手房價格指數相關性 print(stats.pearsonr(gz, sz))結果如下:
F:push20191130>python 1.py (0.4673289851643741, 4.4100775485723706e-07)什么?!!廣州和深圳的二手房價格指數相關性竟然才0.46?那其他一線城市和深圳對比呢?
不過,stats麻煩的地方就在于,它一次只能對比兩個值,不能一次性兩兩對比四個一線城市,別著急,有個模塊可以。
3.2 pandas一次性兩兩對比計算相關性
首先引入pandas:
import pandas as pd創建DataFrame存放四個數據:
df = pd.DataFrame() df['北京'] = bj df['上海'] = sh df['廣州'] = gz df['深圳'] = sz最后相關性計算:
print(df.corr())來看看結果:
wow,看來深圳的二手房價還真是與眾不同,不過從下面這個圖看,確實,深圳的二手房價格和北京的二手房價格已經出現了背離的情況。
個人認為,這個背離和最近的一系列政策及香港局勢有關,但當前嚴峻的金融形勢下,不會持續太久。
我們的文章到此就結束啦,如果你希望我們今天的Python 教程,請持續關注我們,如果對你有幫助,麻煩在下面點一個贊/在看哦
有任何問題都可以在下方留言區留言,我們都會耐心解答的!
?Python實用寶典 (pythondict.com)
不只是一個寶典
歡迎關注公眾號:Python實用寶典
總結
以上是生活随笔為你收集整理的pearsonr() python_Python 来算算一线城市的二手房价格指数相关性的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pmp知识点详解-项目大牛整理_PMP核
- 下一篇: iqueryable怎么进行操作_钢结构