多变量分析绘图及分类属性绘图【知识整理】
生活随笔
收集整理的這篇文章主要介紹了
多变量分析绘图及分类属性绘图【知识整理】
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
多變量分析繪圖及分類屬性繪圖
- 綜述
- 代碼模塊
- 多指標離散圖繪制
- 盒圖
- violin圖
- 條形圖
- 點圖
- 多層面板分類圖
- factorplot()詳細說明
- 小結
綜述
學生黨整理一些關于數據分析的知識:整理了多變量分析繪圖及分類屬性繪圖的相關代碼。主要包括了多指標離散圖的繪制、盒圖的繪制、violin圖的繪制、條形圖的繪制、點圖的繪制、多層面板分類圖的繪制及factorplot()函數的詳細說明。
代碼模塊
調用庫
import seaborn as sns import pandas as pd import numpy as np import matplotlib.pyplot as plt from scipy import stats, integrate導入數據及sns.set設置
sns.set(style="whitegrid", color_codes=True) np.random.seed(sum(map(ord, "categorical"))) #隨機數種子 titanic = pd.read_csv('titanic_train.csv') tips = pd.read_csv('tips.csv') iris = pd.read_csv('iris.csv')多指標離散圖繪制
繪圖未優化前
sns.stripplot(x = "day", y = "total_bill", data = tips,jitter=False) plt.show()
繪圖優化后
繪圖類似正態化優化
增加性別后的正態化優化
將圖片橫向
盒圖
盒圖中,矩形表示IQR,即統計學概念四分位距,數據1/4到3/4之間的距離
N = 1.5IQR 如果一個值 大于3/4+N 或 小于1/4-N,則為離群點
橫向盒圖
violin圖
一半violin圖
sns.violinplot(x = 'total_bill',y = 'day', hue = 'time', data=tips) plt.show()
高級版violin圖
優化后的散點和violin圖結合
條形圖
顯示值的集中趨勢可以用條形圖
sns.barplot(x = 'Sex', y = 'Survived', hue = 'Pclass', data=titanic) plt.show()點圖
可以更好的描述變化差異
sns.pointplot(x = 'Sex', y = 'Survived',hue = 'Pclass', data = titanic) plt.show()
設置顏色,圖標和線條樣式
多層面板分類圖
折線圖
sns.factorplot(x = 'day', y = 'total_bill', hue = 'smoker', data = tips) plt.show()
條形圖
多緯度繪圖
多維度盒圖
factorplot()詳細說明
factorplot()函數中可以使用的參數
- x,y,hue 數據集變量 變量名
- date 數據集 數據名稱
- row,col 更多分類變量進行平鋪顯示 變量名
- col_wrap 每行的最高平鋪數 整數
- estimator 在每個分類中進行矢量到標量的映射 矢量
- ci 置信區間 浮點數或者None
- n_boot計算置信區間時使用的引導迭代次數整數
- units 采樣單元的標識符,用于執行多級引導和重復測量設計 數據變量或向量數據
- order,hue_order 對應排序列表 字符串列表
- row_order,col_order 對應排序列表 字符串列表
| 1 | point | 默認 |
| 2 | bar | 柱形圖 |
| 3 | box | 箱體 |
| 4 | count | 頻次 |
| 5 | violin | 提琴 |
| 6 | strip | 散點 |
| 7 | swarm | 分散點 |
| 8 | size | 每個面的高度(英寸) |
| 9 | aspect | 標量 縱橫比 |
| 10 | orient | 標量 方向“v/h” |
| 11 | color | 顏色 |
| 12 | matplotlib | 顏色 |
| 13 | palette | 調色板 |
| 14 | seaborn | 顏色色板或字典 |
| 15 | legend | hue的信息面板 |
| 16 | True/False legend_out | 是否擴展圖形,并將信息框繪制在中心右邊 |
| 17 | True/Falseshare(x,y) | 共享軸線 |
| 18 | True/False |
小結
繪圖知識整理部分主要針對繪圖方法,具體在數據分析過程中使用哪種圖片在之后具體的數據分析案例中詳細說明。
總結
以上是生活随笔為你收集整理的多变量分析绘图及分类属性绘图【知识整理】的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一键下载2018年PPT合集+送58本运
- 下一篇: AV1 编码器研究之aomenc.exe