【Python】数据可视化教程来了!
來自:Datawhale????數據可視化小組
開源初衷
Matplotlib可以說是python數據可視化最重要且常見的工具之一,幾乎每個和數據打交道的人都不可避免,還有大量可視化工具是基于它的二次開發。
開源教程的設計初衷源于筆者最初用python做數據可視化時面臨兩大痛點,
繪圖時現用現查,用過即忘,效率極低
只會復制粘貼,不知其所以然,面對復雜圖表一籌莫展
如果屏幕前的你,也正在面臨這兩個痛點,那么學習本項目教程將會是一個不錯的選擇。
本項目重點希望在兩個層面幫助讀者構建matplotlib的知識體系(文末有開源教程地址):
從圖形,布局,文本,樣式等多維度系統梳理matplotlib的繪圖方法,構建對于繪圖方法的整體理解
從繪圖API層級,接口等方面闡明matplotlib的設計理念,擺脫只會復制粘貼的尷尬處境
關于本項目的名稱,Fantastic-Matplotlib,在筆者精讀過官網文檔之后,才愈發覺得精妙,仿佛看到了一角下的廣袤冰山,被它強大的功能和精巧的設計驚艷到了,之前對于matplotlib的了解還是過于淺薄,因此想用fantastic來表示筆者的感慨,也希望能夠通過這樣一個開源教程帶領讀者領略的matplotlib的精彩之處。
開源教程
Fantastic-Matplotlib共有5個章節,筆者為每一個章節寫了一句小詩作為回目名,因為在筆者看來,可視化不僅僅是一項技術,更是一件充滿了藝術性的事情,在使用可視化庫畫圖表時,常常想象自己在一塊畫布上自由地畫水粉畫。
第一回:Matplotlib初相識
第二回:藝術畫筆見乾坤
第三回:布局格式定方圓
第四回:文字圖例盡眉目
第五回:樣式色彩秀芳華
這五個章節將從不同的維度(matplotlib概述,繪圖元素,布局格式,文字圖例,樣式色彩)介紹如何進行可視化繪圖。
第一回:Matplotlib初相識
第一回是引子,首先介紹了matplotlib可視化繪圖包的特點,然后通過一個極簡的可視化例子告訴讀者如何用最簡單的幾行代碼畫出一幅可視化圖表,最后簡單介紹一幅可視化圖表figure的組成和兩種繪圖接口。
兩種繪圖接口對初學者來說是一個難點,兩種最常用的繪圖接口特點如下:
顯式創建figure和axes,在上面調用繪圖方法,也被稱為OO模式(object-oriented style);
依賴pyplot自動創建figure和axes,并繪圖。
他們的區別在于OO模式更為底層,是一種面向對象的思路,從代碼上更為復雜,但同時也更靈活。pyplot是面向過程的思路,matplotlib對其做了更高級的封裝,使用時只用關注想要實現什么效果即可,而不用涉及到對象本身,代碼上更為簡潔,但在靈活性上不夠OO模式自由。
通過第一章的學習,即使是零基礎的讀者也能夠對matplotlib具有初步的了解,作為可視化的入門,學習如何畫一個最簡單的可視化例子。
第二回:藝術畫筆見乾坤
第二回是這個數據可視化教程中最重要的一個章節,整個章節都圍繞Artist對象展開。Artist對象在matplotlib宇宙中是一個極為重要的概念,實際上我們在做可視化時幾乎接觸到的所有對象元素都屬于artist對象。
Artist對象可以分為兩大類,基本元素primitives和容器對象container。基本元素指的是我們想在可視化畫布上填上的標準元素,比如一條線,一個矩形,一段文字,一張外部圖片,以上這些都屬于基本元素的范疇。而容器對象指的是用來放置那些基本元素的對象,如Figure(完整的畫布),Axes(子圖),Axis(坐標軸)。按照官網的說法,我們在用matplotlib做可視化圖表時,95%的時間都是在和Artist打交道,因此熟練掌握artist是學好數據可視化的關鍵。
本章首先介紹了matplotlib畫圖的三層API,其中前兩層都屬于底層API,通常我們打交道的都位于最上層的API中,進而引入了最上層API中artist的概念和分類,然后介紹matplotlib的標準使用流程,簡單來說分為三步:
創建一個Figure實例;
使用Figure實例創建一個或者多個Axes或Subplot實例;
使用Axes實例的輔助方法來創建primitive。
在介紹完以上這些概念后,本章節詳細講解了常用基本元素和容器對象的使用方法。通過本章的學習,所有常見圖表(折線圖,柱狀圖,餅圖等)的雛形都已經可以畫出來了,并且你還可以根據實際需要自由組合不同基本元素搭建更為復雜的圖表。
在本章中還針對artist元素,重點演示兩種繪圖接口的使用方法,對于常見的基本元素,matplotlib都提供了OO模式和pyplot模式的現成方法供使用者選擇。
本質上我們繪制一幅可視化圖表就是在容器對象(container)上填充和組合基本元素(primitive)的過程,像極了現實中繪畫的過程。
第三回~第五回
第三~五章是對于一幅可視化圖表的進一步修飾與加工,分別從布局格式,文字圖例,樣式色彩三方面對圖表進行修飾。
第三章重點講解了如何在一張大畫布上劃分均勻和非均勻的子圖以進行多圖展示,豐富圖表內容。
第四章重點講解了如何在圖表上的不同功能區(figure,axes,tick,legend)上添加文字,修改文字樣式和顯示內容,精準的文字表述也是可視化圖表的一個重要組成元素。
第五章重點講解了如何在圖表上設置圖表的樣式和色彩,從而讓可視化圖表更美觀,看起來更像是一幅藝術作品。
最后還想說的是,對于學習完本教程的讀者,若是仍然覺得學有余力不過癮,強烈建議按需閱讀官方文檔,相信你一定會有所收獲的。
核心貢獻者:楊劍礪、楊煜、居鳳霞、耿遠昊、李運佳
Fantastic-Matplotlib開源地址
https://github.com/datawhalechina/fantastic-matplotlib
或點擊閱讀原文獲取,歡迎star!
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯溫州大學《機器學習課程》視頻 本站qq群851320808,加入微信群請掃碼:總結
以上是生活随笔為你收集整理的【Python】数据可视化教程来了!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Win11更新22000.100后面部识
- 下一篇: 【Python】这款拓展让你的jupyt