日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

【Python基础】Pandas数据可视化原来也这么厉害

發布時間:2025/3/8 python 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【Python基础】Pandas数据可视化原来也这么厉害 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、可視化概述

在Python中,常見的數據可視化庫有3個:

matplotlib:最常用的庫,可以算作可視化的必備技能庫,比較底層,api多,學起來不太容易。

seaborn:是建構于matplotlib基礎上,能滿足絕大多數可視化需求,更特殊的需求還是需要學習matplotlib。

pyecharts:上面的兩個庫都是靜態的可視化庫,而pyecharts有很好的web兼容性,可以做到可視化的動態效果。并且種類也比較豐富。比如這個圖,就非常厲害:畫圖神器pyecharts-旭日圖

Pandas:而今天要講的是Pandas的可視化,Pandas主要作為數據分析的庫,雖然沒有上述三個庫那個強大,但是勝在方便,在數據分析的過程中,只要一行代碼就能實現。并且圖形也非常漂亮。

二、直接看案例

Pandas 中,有11個比較常見的圖形可視化,還有幾個比較進階的,我們一個一個看看怎么畫的

import pandas as pd import numpy as np df= pd.DataFrame(np.random.rand(10, 4), columns=['A','B','C','D'])

01、柱狀圖-縱向

df.plot.bar()

? ? ? ? ? ? ?

stacked=True,畫堆疊柱狀圖

df.plot.bar(stacked=True)

? ? ? ? ? ? ?

?

02、柱狀圖-橫向

df.plot.barh()

? ? ? ? ? ? ?

同樣,stacked=True,畫堆疊柱狀圖

df.plot.barh(stacked=True)

? ? ? ? ? ? ?

?

03、面積圖

df.plot.area(alpha = 0.9)

? ? ? ? ? ? ?

df.plot.area(stacked=True,alpha = 0.9)

? ? ? ? ? ? ?

04、密度圖-kde

df.plot.kde()

? ? ? ? ? ? ?

05、密度圖-density

df.plot.density()

? ? ? ? ? ? ?

?

06、直方圖

換個數據集

df = pd.DataFrame({'A': np.random.randn(1000) + 1,'B': np.random.randn(1000),'C': np.random.randn(1000) - 1},columns=['A', 'B', 'C'])df.plot.hist(bins=200)

? ? ? ? ? ? ?

df.plot.hist(stacked=True, bins=20)

? ? ? ? ? ? ?

?

df= pd.DataFrame(np.random.rand(1000, 4), columns=['A','B','C','D']) df.diff().hist(color='k', alpha=0.7, bins=50)

? ? ? ? ? ? ?

?

07、箱盒圖

df= pd.DataFrame(np.random.rand(100, 4), columns=['A','B','C','D']) df.plot.box()

? ? ? ? ? ? ?

vert=False也可以換成橫向

df.plot.box(vert=False)

? ? ? ? ? ? ?

?

08、散點圖

df.plot.scatter(x='A',y='B')

? ? ? ? ? ? ?

?

09、蜂巢圖

df = pd.DataFrame(np.random.randn(1000, 2), columns=['a', 'b']) df['b'] = df['b'] + np.arange(1000) df.plot.hexbin(x='a', y='b', gridsize=25)

?

? ? ? ? ? ? ?

07、餅圖

series = pd.Series(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], name='series') series.plot.pie(figsize=(6, 6))

? ? ? ? ? ? ?

series.plot.pie(labels=['AA', 'BB', 'CC', 'DD'], colors=['r', 'g', 'b', 'c'],autopct='%.2f', fontsize=20, figsize=(6, 6))

? ? ? ? ? ? ?

?

08、矩陣散點圖

from pandas.plotting import scatter_matrix df = pd.DataFrame(np.random.randn(1000, 4), columns=['a', 'b', 'c', 'd']) scatter_matrix(df, alpha=0.2, figsize=(6, 6), diagonal='kde')

? ? ? ? ? ? ?

?

09、安德魯斯曲線

加載自己的數據,關注公眾號【AI入門學習】回復?iris 獲取數據集

data = pd.read_csv('C:/Users/wuzhengxiang/Desktop/iris.csv') pd.plotting.andrews_curves(data , 'Name')

? ? ? ? ? ? ?

andrews_curves(data, 'Name', colormap='winter')

? ? ? ? ? ? ?

?

10、平行坐標圖

該圖也是使用自己加載的iris數據集

from pandas.plotting import parallel_coordinates parallel_coordinates(data, 'Name', colormap='gist_rainbow')

? ? ? ? ? ? ?

?

11、Lag Plot

from pandas.plotting import lag_plot df= pd.Series(0.1 * np.random.rand(1000) +0.9 * np.sin(np.linspace(-99 * np.pi, 99 * np.pi, num=1000))) lag_plot(df)

? ? ? ? ? ? ?

?

12、默認函數plot

直接畫圖,默認為折線圖

df= pd.DataFrame(np.random.rand(12, 4), columns=['A','B','C','D']) df.plot()

? ? ? ? ? ? ?

df.plot(subplots=True,layout=(2, 2), figsize=(15, 8))

? ? ? ?

df= pd.DataFrame(np.random.rand(1000, 4), columns=['A','B','C','D']) df.plot()

? ? ? ? ? ? ?

df.plot(subplots=True,layout=(2,?2),?figsize=(15,?8))

? ? ? ? ? ? ?

?

13、bootstrap_plot

s = pd.Series(np.random.uniform(size=100)) pd.plotting.bootstrap_plot(s)

? ? ? ? ? ? ?

?

?

三、參數詳解

1、官方文檔

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.html

https://pandas.pydata.org/pandas-docs/version/0.18.1/visualization.html

2、參數介紹

DataFrame.plot(x=None, y=None, kind='line', ax=None, subplots=False, sharex=None, sharey=False, layout=None, figsize=None, use_index=True, title=None, grid=None, legend=True, style=None, logx=False, logy=False, loglog=False, xticks=None, yticks=None, xlim=None, ylim=None, rot=None, fontsize=None, colormap=None, position=0.5, table=False, yerr=None, xerr=None, stacked=True/False, sort_columns=False, secondary_y=False, mark_right=True, **kwds) e, legend=True, style=None, logx=False, logy=False, loglog=False, xticks=None, yticks=None, xlim=None, ylim=None, rot=None, fontsize=None, colormap=None, position=0.5, table=False, yerr=None, xerr=None, stacked=True/False, sort_columns=False, secondary_y=False, mark_right=True, **kwds)

注意:每種繪圖類型都有相對應的方法: df.plot(kind='line')與df.plot.line()等價

x : label or position, default None#指數據列的標簽或位置參數

y : label, position or list of label, positions, default None

kind : str#繪圖類型

‘line’ : line plot (default)#折線圖

‘bar’ : vertical bar plot#條形圖。stacked為True時為堆疊的柱狀圖

‘barh’ : horizontal bar plot#橫向條形圖

‘hist’ : histogram#直方圖(數值頻率分布)

‘box’ : boxplot#箱型圖

‘kde’ : Kernel Density Estimation plot#密度圖,主要對柱狀圖添加Kernel 概率密度線

‘density’ : same as ‘kde’

‘area’ : area plot#與x軸所圍區域圖(面積圖)。Stacked=True時,每列必須全部為正或負值,stacked=False時,對數據沒有要求

‘pie’ : pie plot#餅圖。數值必須為正值,需指定Y軸或者subplots=True

‘scatter’ : scatter plot#散點圖。需指定X軸Y軸

‘hexbin’ : hexbin plot#蜂巢圖。需指定X軸Y軸

‘hexbin’ : hexbin plot#蜂巢圖。需指定X軸Y軸

ax : matplotlib axes object, default None#**子圖(axes, 也可以理解成坐標軸) 要在其上進行繪制的matplotlib subplot對象。如果沒有設置,則使用當前matplotlib subplot**其中,變量和函數通過改變figure和axes中的元素(例如:title,label,點和線等等)一起描述figure和axes,也就是在畫布上繪圖。

subplots : boolean, default False#是否對列分別作子圖

sharex : boolean, default True if ax is None else False#如果ax為None,則默認為True,否則為False

In case subplots=True, share x axis and set some x axis labels to invisible; defaults to True if ax is None otherwise False if an ax is passed in; Be aware, that passing in both an ax and sharex=True will alter all x axis labels for all axis in a figure!

sharey : boolean, default False#如果有子圖,子圖共y軸刻度,標簽

In case subplots=True, share y axis and set some y axis labels to invisible

layout : tuple (rows, columns) for the layout of subplots#子圖的行列布局

figsize : a tuple (width, height) in inches#圖片尺寸大小

use_index : boolean, default True#默認用索引做x軸

title : string#圖片的標題用字符串

Title to use for the plot

grid : boolean, default None#圖片是否有網格

legend : False/True/’reverse’#子圖的圖例 (默認為True)

style : list or dict#對每列折線圖設置線的類型

logx : boolean, default False#設置x軸刻度是否取對數

logy : boolean, default False

loglog : boolean, default False#同時設置x,y軸刻度是否取對數

xticks : sequence#設置x軸刻度值,序列形式(比如列表)

yticks : sequence#設置y軸刻度,序列形式(比如列表)

xlim : float/2-tuple/list#設置坐標軸的范圍。數值(最小值),列表或元組(區間范圍)

ylim : float/2-tuple/list

rot : int, default None#設置軸標簽(軸刻度)的顯示旋轉度數 ?

fontsize : int, default None#設置軸刻度的字體大小

colormap : str or matplotlib colormap object, default None#設置圖的區域顏色

colorbar : boolean, optional? #柱子顏色

If True, plot colorbar (only relevant for ‘scatter’ and ‘hexbin’ plots)

position : float? #條形圖的對齊方式,取值范圍[0,1],即左下端到右上端默認0.5(中間對齊)?

layout : tuple (optional)? #布局。layout=(2, 3)兩行三列,layout=(2, -1)兩行自適應列數

Eg. df.plot(subplots=True, layout=(2, -1), sharex=False)

table : boolean, Series or DataFrame, default False ?#圖下添加表。如果為True,則使用DataFrame中的數據繪制表格,并且數據將被轉置以滿足matplotlib的默認布局。。

yerr : DataFrame, Series, array-like, dict and str

See Plotting with Error Bars for detail.

xerr : same types as yerr.

stacked : boolean, default False in line and bar plots, and True in area plot. If True, create stacked plot. #前面有介紹

sort_columns : boolean, default False? #對列名稱進行排序以確定繪圖順序

secondary_y : boolean or sequence, default False? #設置第二個y軸(右輔助y軸)

Whether to plot on the secondary y-axis If a?list/tuple, which columns to plot on secondary y-axis

mark_right : boolean, default True

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯 獲取本站知識星球優惠券,復制鏈接直接打開: https://t.zsxq.com/qFiUFMV 本站qq群704220115。加入微信群請掃碼:

總結

以上是生活随笔為你收集整理的【Python基础】Pandas数据可视化原来也这么厉害的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。