日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

多变量分析绘图及分类属性绘图【知识整理】

發布時間:2023/12/31 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 多变量分析绘图及分类属性绘图【知识整理】 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

多變量分析繪圖及分類屬性繪圖

  • 綜述
  • 代碼模塊
    • 多指標離散圖繪制
    • 盒圖
    • violin圖
    • 條形圖
    • 點圖
    • 多層面板分類圖
    • factorplot()詳細說明
  • 小結

綜述

學生黨整理一些關于數據分析的知識:整理了多變量分析繪圖及分類屬性繪圖的相關代碼。主要包括了多指標離散圖的繪制、盒圖的繪制、violin圖的繪制、條形圖的繪制、點圖的繪制、多層面板分類圖的繪制及factorplot()函數的詳細說明。

代碼模塊

調用庫

import seaborn as sns import pandas as pd import numpy as np import matplotlib.pyplot as plt from scipy import stats, integrate

導入數據及sns.set設置

sns.set(style="whitegrid", color_codes=True) np.random.seed(sum(map(ord, "categorical"))) #隨機數種子 titanic = pd.read_csv('titanic_train.csv') tips = pd.read_csv('tips.csv') iris = pd.read_csv('iris.csv')

多指標離散圖繪制

繪圖未優化前

sns.stripplot(x = "day", y = "total_bill", data = tips,jitter=False) plt.show()


繪圖優化后

sns.stripplot(x = "day", y = "total_bill", data = tips,jitter=False) plt.show()


繪圖類似正態化優化

sns.swarmplot(x = 'day',y = 'total_bill',data = tips) plt.show()


增加性別后的正態化優化

sns.swarmplot(x = "day", y = "total_bill", hue="sex",data = tips) plt.show()


將圖片橫向

sns.swarmplot(x = 'total_bill', y = 'day', hue = "time",data=tips) plt.show()

盒圖

盒圖中,矩形表示IQR,即統計學概念四分位距,數據1/4到3/4之間的距離
N = 1.5IQR 如果一個值 大于3/4+N 或 小于1/4-N,則為離群點

sns.boxplot(x = 'day', y = 'total_bill', hue = 'time', data=tips) plt.show()


橫向盒圖

sns.boxplot(data=iris, orient='h') plt.show()

violin圖

一半violin圖

sns.violinplot(x = 'total_bill',y = 'day', hue = 'time', data=tips) plt.show()


高級版violin圖

sns.violinplot(x = 'day', y = 'total_bill', hue = 'sex',data = tips,split = True) plt.show()


優化后的散點和violin圖結合

sns.violinplot(x = 'day', y = 'total_bill', data=tips, inner=None) sns.swarmplot(x = 'day', y = 'total_bill', data = tips, color='w',alpha = .5) plt.show()

條形圖

顯示值的集中趨勢可以用條形圖

sns.barplot(x = 'Sex', y = 'Survived', hue = 'Pclass', data=titanic) plt.show()

點圖

可以更好的描述變化差異

sns.pointplot(x = 'Sex', y = 'Survived',hue = 'Pclass', data = titanic) plt.show()


設置顏色,圖標和線條樣式

sns.pointplot(hue = 'Sex', y = 'Survived',x = 'Pclass', data = titanic,palette= {'male':'g','female':'m'},markers=['^','o'],linestyles=['-','--']) plt.show()

多層面板分類圖

折線圖

sns.factorplot(x = 'day', y = 'total_bill', hue = 'smoker', data = tips) plt.show()


條形圖

sns.factorplot(x = 'day', y = 'total_bill', hue = 'smoker', data = tips,kind = 'bar') plt.show()


多緯度繪圖

sns.factorplot(x = 'day', y = 'total_bill', hue = 'smoker',col = 'time', data = tips, kind = 'swarm') plt.show()


多維度盒圖

sns.factorplot(x = 'time', y = 'total_bill', hue = 'smoker',col = 'day', data = tips, kind = 'box', size = 4, aspect = .5) plt.show()

factorplot()詳細說明

factorplot()函數中可以使用的參數

  • x,y,hue 數據集變量 變量名
  • date 數據集 數據名稱
  • row,col 更多分類變量進行平鋪顯示 變量名
  • col_wrap 每行的最高平鋪數 整數
  • estimator 在每個分類中進行矢量到標量的映射 矢量
  • ci 置信區間 浮點數或者None
  • n_boot計算置信區間時使用的引導迭代次數整數
  • units 采樣單元的標識符,用于執行多級引導和重復測量設計 數據變量或向量數據
  • order,hue_order 對應排序列表 字符串列表
  • row_order,col_order 對應排序列表 字符串列表
kind可選
1point默認
2bar柱形圖
3box箱體
4count頻次
5violin提琴
6strip散點
7swarm分散點
8size每個面的高度(英寸)
9aspect標量 縱橫比
10orient標量 方向“v/h”
11color顏色
12matplotlib顏色
13palette調色板
14seaborn顏色色板或字典
15legendhue的信息面板
16True/False legend_out是否擴展圖形,并將信息框繪制在中心右邊
17True/Falseshare(x,y)共享軸線
18True/False

小結

繪圖知識整理部分主要針對繪圖方法,具體在數據分析過程中使用哪種圖片在之后具體的數據分析案例中詳細說明。

總結

以上是生活随笔為你收集整理的多变量分析绘图及分类属性绘图【知识整理】的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。