pandas显示全部数据内容_1行Python代码就能挖掘数据!这个库太神奇啦!
Pandas 是 Python 中處理數據的首選庫,它使用起來很容易,非常靈活,能夠處理不同類型和大小的數據,而且它有大量的函數,這讓操作數據簡直是小菜一碟。
在30 秒內,完成你全部的標準數據分析,這就是用pandas進行數據分析產生的“奇跡”。
1
Pandas 基礎之旅
用 Python 處理過數據的人大概對 pandas 不陌生。
如果想處理行或列排序的格式化數據,大多數情況下,你可以使用 pandas 處理。如果沒安裝 pandas,可以用你喜歡的命令終端安裝,一定要用 pip 命令:
pip install?pandas現在,讓我們看看默認的 pandas 實現都可以做什么:
非常簡潔,但也很平淡無奇,“method”這列去哪兒?
我們解釋一下上面代碼和輸出的含義:
Pandas 的任何“數據幀”都有一個 describe() 方法,這個方法會返回上面的輸出。但請注意,這個方法的以上輸出數據中,關于類別的變量漏掉了。在上面的例子中,輸出信息里,“method”這一列被完全移除。
讓我們看看是否能做得更好。
2
Pandas 剖析
如果我告訴你,我僅用 3 行 Python 代碼即可生成以下統計數據,你會感覺如何(如果不算 imports 語句的話,實際上只需要 1 行代碼即可):
核心信息:類型、唯一值、缺失值
分位數統計:如最小值、Q1、中位數、Q3、最大值、范圍、四分位數范圍等
描述性統計:如平均值、眾數、標準差、求和、中位數絕對偏差、擾動系數、峰度、偏度等
高頻使用的數值
直方圖
相關性:會突出顯示高相關度變量、Spearman、Pearson 和 Kendall 矩陣
缺失值:矩陣、計數、熱力圖和缺失值樹狀圖
(以上特征列表直接摘自?Pandas Profiling GitHub 頁面)
使用 Pandas Profiling 包,我們僅用 1 行代碼就可以得到以上數據!在命令行終端只需使用 pip 即可安裝 Pandas Profiling 包:
pip install?pandas_profiling乍一看,經驗豐富的數據分析師可能會嘲笑這是華而不實的,但是,它可以幫助你快速獲得你擁有的數據概況:
看到了嗎,正如我所說,1 行代碼搞定!
你看到的第一部分內容是“概覽”(請看上圖),這部分內容會呈現給你一些非常高級的數據和變量統計,以及像變量高相關性和高偏態性等這類警告。
但是它提供的信息遠遠不止這些。往下滑動,我們會發現這份輸出報告包含多個部分。僅用圖片顯示這個 1 行代碼的輸出都是不大合適的,所以我制作了一張 GIF 圖:
我強烈建議你自己來探索這個軟件包里的特色——畢竟,這只有 1 行代碼,而且你會在以后的數據分析中發現這個軟件包真的很好用。
import?pandas as?pdimport?pandas_profiling
pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/planets.csv').profile_report()-?END -
本文為轉載分享&推薦閱讀,若侵權請聯系后臺刪除
愛數據·8月數據職場專題直播
直播主題:數據分析面試·如何應對業務問題?
內容劇透:
數據分析師業務問題分類
常見業務面問題都有哪些?
回答業務面的要點以及策略
題目1:網站銷售額下降專題分析
題目2:用戶流失專題分析
直播時間:8月6日 本周四20:30
點擊下方立即預約本次直播!總結
以上是生活随笔為你收集整理的pandas显示全部数据内容_1行Python代码就能挖掘数据!这个库太神奇啦!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 燕云十六声装备耐久恢复方法
- 下一篇: python朋友圈自动点赞_基于AirT