python 两个数据框合并计算_一文掌握Excel、SQL、Python【数据合并】大法!
文章最后有錄制的講解視頻,如果看文章不舒服的話,可以直接滑到文末看視頻,希望你能喜歡~
在工作中,會經常遇到將多張表合并為一張表的需求;在面試的時候,有時也會被面試官問到左連接、右連接、內連接的區別。本文介紹了常用軟件(包括Excel、Power BI、MySQL、Python),進行數據橫向連接的方法。
本文用到的數據是簡化的醫藥銷售數據,包括訂單表、機構信息表、價格表,現在需要將三張表拼接成一張表,表數據如下截圖:
第一種方法,使用vlookup函數
以sales表為主表,使用vlookup函數將price表和institution表的數據引用到sales表里,vlookup函數:=VLOOKUP([@SKU],Price!$A$1:$C$18,3,FALSE),效果如下截圖。如果附表的字段較多,需要使用多個vlookup函數,另外如果數據量較大,軟件容易崩潰,因此在海量數據情況下,不推薦使用這個方法。
第二種方法,使用Excel BI里面的Power Query
從Excel數據選項卡下的獲取和轉換可以進入到PQ界面,先將三份數據分別導入到PQ里面,使用PQ的合并查詢功能,先將sales表和price表合并,再和institution表進行合并。優勢是對字段數量和記錄數量沒有要求,可以便捷的實現海量數據的合并。主要截圖如下:
第三種方法,使用MySQL
如果數據不再數據庫里,使用這種方法比較麻煩。先將數據導入到數據庫,數據庫只能導入csv文檔或者txt文檔,需要先將Excel的三個表另存為UTF8編碼的csv文檔,再將三個文檔拷貝到安全路徑下(不在安全路徑,數據庫不能導入外部數據),使用多表查詢語句,將查詢結果導出到外部文件,具體代碼如下:
#創建數據庫第四種方法,使用python
先將數據導入到Python里,再進行多表連接,代碼如下:
#導入pandas包將以上四種方法錄制了視頻,更詳細內容請觀看:
知乎視頻?www.zhihu.com歡迎關注我們團隊的知乎及其他平臺賬號+_+
知乎:曹亮http://cda.cn
微信公眾號:數據愛好者記
B站:數據愛好者記
CSDN:數據愛好者記
總結
以上是生活随笔為你收集整理的python 两个数据框合并计算_一文掌握Excel、SQL、Python【数据合并】大法!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: nginx 一个请求发给多台机器_一个机
- 下一篇: oracle导入导出版本规则,oracl