日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python相比于excel的优势_对照Excel使用Python进行数据分析,更快掌握

發布時間:2025/3/15 python 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python相比于excel的优势_对照Excel使用Python进行数据分析,更快掌握 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Excel和Python,作為數據分析的主流工具,在從效率提升到數據商業化的整個過程中,都起到了重要作用。不管是在Excel中通過鼠標點選實現,亦或是利用Python通過代碼實現,數據分析中的很多基礎功能都是相通的。

在數據量級大躍進的今天,對于從業者來說,熟練掌握用于數據處理的編程語言非常必要,通曉兩者可以更增競爭力。而借助大家最為熟悉的Excel操作,對照學習相應的Python實現,可以幫助更快理解,輕松掌握。

都說Excel關鍵要掌握4個核心函數(vlookup,if,sum,sumif)和1個核心功能(數據透視表),本期我們就聚焦在廣受喜歡的數據透視表和VLOOKUP的操作。

數據透視表

使用數據透視表,可以快速匯總數據,進而進行進一步的分析。

例如,對于一張簡單的家庭開支列表,可以基于該列表制作數據透視表

1.Excel實現

使用數據透視表,在“插入”——“數據透視表”,選中需要創建數據透視表的數據。

我們可以看到如下界面:上半部分為數據透視表中的所有字段,下半部分為數據透視表的選項,把上方的字段拖入下方對應框中即可完成數據透視表。

這里使用2018年國內上市公司管理層報酬統計數據為例,以“公司行業”為行標簽,“公司組織形式”為列標簽,對“年度報酬總額(萬元)”數據計算平均數,得到如下分類匯總和聚合計算。

2.Python實現

Python中數據透視表的實現原理與Excel類同,使用pandas庫中的pivot_table()方法。data:要進行數據透視表操作的DataFrame對象

values:要進行值計算的列,對應Excel操作中“數值”框

index:行索引,對應Excel操作中“行標簽”框

columns:列名,對應Excel操作中“列標簽”框

aggfunc:設定對values要進行的計算類型

fill_value:對空值的填充值

margins:是否顯示合計列

dropna:是否刪除缺失值

margins_name:設置合計列的列名

當然,我們可以進行更多靈活操作,如對各類別的“前三名高管報酬總額”求中位數,對“年度報酬總額”求均值,這種對不同的值進行不同類型計算,可以通過aggfunc傳入字典(鍵為列名,值為計算方式)來設定。

VLOOKUP

實際工作中,我們經常會需要用到查找功能,VLOOKUP很多時候是Excel用戶學習的第一個查找函數,也是Excel最常使用的三個函數之一,被稱為Excel中的效率之王。它應用非常廣泛,比如可以將多表匹配、合并,達到對比、查漏等效果,甚至前段時間新誕生的xlookup也借著它的大名火了一把。

例如,在如下信息表中,我們可以查找到與ID號102完全匹配的姓氏,進行返回。

1.Excel實現

VLOOKUP這個名稱中,v為vertical豎直的意思,lookup即為查找,它實現的是縱向按列查找,返回該列所需查詢序列所對應的值。

函數表示:

即:VLOOKUP(你想要查找的內容, 要查找的范圍, 包含要返回的值的區域中的列號, 返回近似或精確匹配)

這里我們繼續使用2018年國內上市公司管理層報酬統計數據,需要查找指定的10家上市公司名稱、年度報酬總額、前三名董事報酬總額,及前三名高管報酬總額。在Excel中,就可使用VLOOKUP函數實現,如L2的名稱數據,是以J2為要進行查找的關鍵字,查找范圍為A2:H3594,返回列數為2(表示查找范圍的第2列,即“名稱”),匹配模式為FALSE(表示精確匹配)而得到。

2.Python實現

Python中有多種方法可以實現該操作,推薦使用pandas庫中的merge()函數,它是全功能、高性能的連接操作,在習慣上非常類似于SQL等關系數據庫。left:參與合并的左側DataFrame

right:參與合并的右側DataFrame

how:合并方式,為inner,outer,left,right其中之一

on:用于連接的列名,必須存在于左右兩側數據

left_on:左側DataFrame中用作連接鍵的列

right_on:右側DataFrame中用作連接鍵的列

left_index:將左側的行索引用作其連接鍵

right_index:將右側的行索引用作其連接鍵

sort:根據連接鍵對合并后的數據進行排序

通過how進行設置的合并方法,主要取決于merge操作的目的:

若只需要查找到指定的10家上市公司數據,則可采用左連接,以放在左側的avgs數據為基準;

若主要想對右側salary數據中的3593家上市公司管理層報酬數據進行分析,僅是將已有的員工人均薪酬數據加入,則可考慮使用右連接;

若想保留同時出現在左右兩側的數據,則可考慮使用內連接,取鍵的交集;

若想將左右兩側數據都進行保留,則可考慮使用外連接,取鍵的并集。

除了使用on指定連接鍵,我們也可將代碼設置為index,通過index作為連接鍵進行匹配

總結

以上是生活随笔為你收集整理的python相比于excel的优势_对照Excel使用Python进行数据分析,更快掌握的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。