當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

seaborn常用图

發布時間：2025/3/20 编程问答 28 豆豆

生活随笔收集整理的這篇文章主要介紹了 seaborn常用图小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

首先導包，下面會使用sklearn自帶的數據集來演示畫圖操作

from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt import pandas as pd

X，Y分別表示鳶尾花的特征和標簽，下面的畫圖會使用到X,Y。下面的畫圖有的是Dataframe列名，有的是numpy數據

注意:這里我直接用numpy類型，并未轉成DataFrame類型

加載sklearn的鳶尾花數據，共150條數據，每個數據有、'sepal length ', 'sepal width ', 'petal length ', 'petal width' 4個特征，共'setosa', 'versicolor', 'virginica'三種類別。

?上面的ci=0用于去掉圖中的陰影，可以去掉ci=0看看效果。

上面我并未通過DataFrame關鍵字來獲取指定列，所以坐標軸沒有標簽，我手動plt.xlabel和plt.ylabel進行了指定坐標軸標簽。

?注意：這里可以使用向量而不使用DataFrame中的列名

散點圖是分析兩個特征變量直接的關系，如果是線性關系，我們就可以去除其中一個特征，相當于去除冗余特征

1、普通散點圖

?解釋跟上面的線圖一樣

2、分組散點圖

按點所屬的類型來進行不同標記，使用hue參數來指分組。下面的hue是指樣本的標簽target，sns會自動根據標簽的不同來分組，即'setosa', 'versicolor', 'virginica'三組，因此有三種不同顏色的點。

?下面增加了style=Y參數，這個也是分組的功能，根據style所選參數來分組點，不同類別的點采用不同的形狀，Y有三種類別，所以有三種形狀的點

注意：這里強制使用DataFrame類型，所以現將X轉成了DataFrame類型

將每一列與其他類畫散點圖，上面的數據集有4個特征，所以有4*4個圖

注意，這個參數必須是DataFrame類型

注意：這里可以使用向量作為輸入，不需要列名

1、指定參數為x=,即以x軸作為類別，y軸作為計數個數

?2、指定參數y=,即以y軸作為類別，x軸作為計數個數

直方圖是數值數據分布的精確圖形表示。這是一個連續變量的概率分布的估計，直方圖的畫法如下：

?1、普通直方圖

直方圖默認組數是9組，可以通過bins參數來調整組數，橫軸是變量的數值范圍，縱軸是落在區間的個數

下面的，kde=True參數是畫帶核密度的直方圖

2、分類直方圖：根據數據所屬類別的來畫直方圖

?解釋：上面的三種不同顏色代表三種鳶尾花，通過hue=Y來給數據劃分。沒給數據X[i, 0]都對應一個Y標簽，所以得出三種顏色的柱子。通過x=X[:,0]來指定柱子的方向在x，如果指定y=X[:,0]那么將在y軸顯示柱子。

回歸圖會自動完成回歸擬合，用于分析特征變量之間是否存在關系。

注意：下圖是官網的參數介紹，這個函數必須提供，特征X, 特征Y， data，而且只能是DataFrame類型的列名，通過hue來進行分組。

?下圖是通過hue=Y參數來進行分組，Y有三種類型，所以有三種不同顏色的點

以上是生活随笔為你收集整理的seaborn常用图的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。