python相关性分析的散点图怎么做_Python:matplotlib 和 Seaborn 之散点图和相关性 (三十二)...
散點圖
如果我們想研究兩個數(shù)字變量之間的關(guān)系,通常會選擇散點圖。在散點圖中,每個數(shù)據(jù)點都單獨表示為一個點,x 軸對應(yīng)一個特征值,y 軸對應(yīng)另一個特征值。創(chuàng)建散點圖的一個基本方式是利用 Matplotlib 的 scatter 函數(shù):
plt.scatter(data = df, x = 'num_var1', y = 'num_var2')
可以在這兩個變量之間看到一個基本的正向關(guān)系,x 軸的值越高,y 軸上的變量值也增大。
替代方法
Seaborn 的 regplot 函數(shù)會創(chuàng)建散點圖并進行回歸函數(shù)擬合:
sb.regplot(data = df, x = 'num_var1', y = 'num_var2')
默認(rèn)情況下,回歸函數(shù)是線性的,并包含帶陰影的回歸估計置信區(qū)域。在這種情況下,因為看起來像 log(y) ~ x 關(guān)系,因此用原始單位繪制回歸線不合適。如果我們不關(guān)心回歸線,那么可以在 regplot 函數(shù)調(diào)用中設(shè)置 reg_fit = False。否則,如果我們想對觀察到的數(shù)據(jù)關(guān)系繪制回歸線,需要變換數(shù)據(jù),如上節(jié)課中所述。
def log_trans(x, inverse = False):
if not inverse:
return np.log10(x)
else:
return np.power(10, x)
sb.regplot(df['num_var1'], df['num_var2'].apply(log_trans))
tick_locs = [10, 20, 50, 100, 200, 500]
plt.yticks(log_trans(tick_locs), tick_locs)
注意,x 軸和 y 軸值可以直接設(shè)為 Series 或數(shù)組,而不是參考 dataframe 中的列。
為者常成,行者常至
總結(jié)
以上是生活随笔為你收集整理的python相关性分析的散点图怎么做_Python:matplotlib 和 Seaborn 之散点图和相关性 (三十二)...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python一行代码实现99乘法表_一行
- 下一篇: python编程入门详解_python编