单变量分析绘图及回归分析绘图【知识整理】
生活随笔
收集整理的這篇文章主要介紹了
单变量分析绘图及回归分析绘图【知识整理】
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
單變量分析繪圖及回歸分析繪圖
- 綜述
- 代碼模塊
- 單變量分析繪圖
- 數據直方圖
- 數據分布狀態
- 指定均值及協方差生成數據
- 散點圖觀測
- 多特征分析
- 回歸分析繪圖
- tips數據集讀入
- 繪制回歸圖
- 離散型數據分析
- 增加直方圖后的回歸圖繪制
- 小結
綜述
學生黨整理一些關于數據分析的知識:整理了單變量分析繪圖及回歸分析繪圖的部分代碼。主要包括了數據直方圖、數據分布狀態、指定均值協方差生成數據、散點圖繪制、多特征分析;繪制回歸圖、離散型數據分析及直方圖散點圖結合的回歸圖繪制。
代碼模塊
調用庫
import seaborn as sns import pandas as pd import numpy as np import matplotlib.pyplot as plt from scipy import stats, integrate單變量分析繪圖
數據直方圖
通過數據直方圖可以觀測變量的分布狀況
sns.set(color_codes=True) np.random.seed(sum(map(ord,"distributions")))x = np.random.normal(size=100) sns.distplot(x,kde=False) plt.show()
指定bins = 20
數據分布狀態
數據柱狀圖和曲線圖表示數據分布狀態
x = np.random.normal(6,size=200) sns.distplot(x,kde=False,fit=stats.gamma) plt.show()指定均值及協方差生成數據
mean, cov = [0, 1], [(1, .5),(.5, 1)] #指定均值,協方差 data = np.random.multivariate_normal(mean, cov,200) df = pd.DataFrame(data,columns=['x','y']) print(df)生成數據樣例如下
| 0 | -0.880210 | 1.255051 |
| 1 | 0.191488 | -0.000265 |
| … | … | … |
| 198 | 1.499932 | 3.881606 |
| 199 | 0.893239 | 1.196291 |
散點圖觀測
觀測兩個變量之間的分布關系最好用散點圖
sns.jointplot(x='x',y='y',data=df) plt.show()該方式繪制的散點圖包括了x,y的直方圖
當數據量龐大時可以用hex圖
數據量過大時,直接繪制散點圖會導致多點重合無法分析的情況,采用hex圖,可以將數據劃分區域,用顏色深淺表示
多特征分析
分析多變量中各個變量之間的關系時,可以使用
sns.set() iris = pd.read_csv('iris.csv') #讀入iris數據 iris = sns.load_dataset("iris") sns.pairplot(iris) plt.show()回歸分析繪圖
tips數據集讀入
tips = pd.read_csv('tips.csv') np.random.seed(sum(map(ord, "regression"))) tips = sns.load_dataset('tips') print(tips.head())| 0 | 16.99 | 1.01 | Female | No | Sun | Dinner | 2 |
| 1 | 10.34 | 1.66 | Male | No | Sun | Dinner | 3 |
| 2 | 21.01 | 3.50 | Male | No | Sun | Dinner | 3 |
| 3 | 23.68 | 3.31 | Male | No | Sun | Dinner | 2 |
| 4 | 24.59 | 3.61 | Female | No | Sun | Dinner | 4 |
繪制回歸圖
繪制回歸關系圖時,常用regplot()和lmplot(),推薦使用regplot()。regplot()使用方便, lmplot()功能多,規范要求高。
sns.regplot(x = 'total_bill',y = 'tip',data = tips) plt.title('regplot') plt.show() sns.lmplot(x = 'total_bill',y = 'tip',data = tips) plt.title('lmplot') plt.show()離散型數據分析
直接繪圖
sns.regplot(data=tips,x='size',y='tip') plt.show()
由于數據離散,對回歸結果有影響,可以適當增加波動提高回歸準確性
增加直方圖后的回歸圖繪制
mean, cov = [0, 1], [(1, .5),(.5, 1)] #指定均值,協方差 data = np.random.multivariate_normal(mean, cov,200) df = pd.DataFrame(data,columns=['x','y'])sns.jointplot(x='x',y='y',data=df,kind='reg') plt.show()小結
繪圖知識整理部分主要針對繪圖方法,具體在數據分析過程中使用哪種圖片在之后具體的數據分析案例中詳細說明。
總結
以上是生活随笔為你收集整理的单变量分析绘图及回归分析绘图【知识整理】的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android 架构 JAVA API,
- 下一篇: [USACO12JAN][SPOJ105