seaborn常用图
首先導包,下面會使用sklearn自帶的數據集來演示畫圖操作
from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt import pandas as pdX,Y分別表示鳶尾花的特征和標簽,下面的畫圖會使用到X,Y。 下面的畫圖有的是Dataframe列名,有的是numpy數據
1、lineplot(線圖)
注意:這里我直接用numpy類型,并未轉成DataFrame類型
加載sklearn的鳶尾花數據,共150條數據,每個數據有、'sepal length ', 'sepal width ', 'petal length ', 'petal width' 4個特征,共'setosa', 'versicolor', 'virginica'三種類別。
?
?上面的ci=0用于去掉圖中的陰影,可以去掉ci=0看看效果。
上面我并未通過DataFrame關鍵字來獲取指定列,所以坐標軸沒有標簽,我手動plt.xlabel和plt.ylabel進行了指定坐標軸標簽。
2、scatterplot(散點圖)
?注意:這里可以使用向量而不使用DataFrame中的列名
散點圖是分析兩個特征變量直接的關系,如果是線性關系,我們就可以去除其中一個特征,相當于去除冗余特征
1、普通散點圖
?解釋跟上面的線圖一樣
2、分組散點圖
按點所屬的類型來進行不同標記,使用hue參數來指分組。下面的hue是指樣本的標簽target,sns會自動根據標簽的不同來分組,即'setosa', 'versicolor', 'virginica'三組,因此有三種不同顏色的點。
?下面增加了style=Y參數,這個也是分組的功能,根據style所選參數來分組點,不同類別的點采用不同的形狀,Y有三種類別,所以有三種形狀的點
3、pairplot(成對關系圖)
注意:這里強制使用DataFrame類型,所以現將X轉成了DataFrame類型
將每一列與其他類畫散點圖,上面的數據集有4個特征,所以有4*4個圖
注意, 這個參數必須是DataFrame類型
4、countplot(計數圖)
注意:這里可以使用向量作為輸入,不需要列名
1、指定參數為x=,即以x軸作為類別,y軸作為計數個數
?2、指定參數y=,即以y軸作為類別,x軸作為計數個數
?5、displot(直方圖)
?注意:不是distplot,是displot,distplot已經被官方遺棄,請使用displot
直方圖是數值數據分布的精確圖形表示。 這是一個連續變量的概率分布的估計,直方圖的畫法如下:
?1、普通直方圖
直方圖默認組數是9組,可以通過bins參數來調整組數,橫軸是變量的數值范圍,縱軸是落在區間的個數
下面的,kde=True參數是畫帶核密度的直方圖
?
2、分類直方圖:根據數據所屬類別的來畫直方圖
?解釋:上面的三種不同顏色代表三種鳶尾花,通過hue=Y來給數據劃分。沒給數據X[i, 0]都對應一個Y標簽,所以得出三種顏色的柱子。通過x=X[:,0]來指定柱子的方向在x,如果指定y=X[:,0]那么將在y軸顯示柱子。
6、lmplot回歸圖
回歸圖會自動完成回歸擬合,用于分析特征變量之間是否存在關系。
注意:下圖是官網的參數介紹,這個函數必須提供,特征X, 特征Y, data, 而且只能是DataFrame類型的列名,通過hue來進行分組。
?
?下圖是通過hue=Y參數來進行分組,Y有三種類型,所以有三種不同顏色的點
總結
以上是生活随笔為你收集整理的seaborn常用图的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: KNN识别手写数字MNIST
- 下一篇: KDD_CUP99数据集处理和测试(已处