日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

手把手教你用直方图、饼图和条形图做数据分析(Python代码)

發布時間:2025/3/15 python 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 手把手教你用直方图、饼图和条形图做数据分析(Python代码) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


導讀:對數據進行質量分析以后,接下來可通過繪制圖表、計算某些特征量等手段進行數據的特征分析。

其中,分布分析能揭示數據的分布特征和分布類型。本文就手把手教你做分布分析。

作者:張良均 譚立云 劉名軍 江建明

來源:大數據DT(ID:hzdashuju)

對于定量數據,要想了解其分布形式是對稱的還是非對稱的、發現某些特大或特小的可疑值,可做出頻率分布表、繪制頻率分布直方圖、繪制莖葉圖進行直觀分析;對于定性數據,可用餅圖和條形圖直觀地顯示其分布情況。

01?定量數據的分布分析

對于定量變量而言,選擇“組數”和“組寬”是做頻率分布分析時最主要的問題,一般按照以下步驟進行:

  • 第一步:求極差。

  • 第二步:決定組距與組數。

  • 第三步:決定分點。

  • 第四步:列出頻率分布表。

  • 第五步:繪制頻率分布直方圖。

遵循的主要原則如下:

  • 各組之間必須是相互排斥的。

  • 各組必須將所有的數據包含在內。

  • 各組的組寬最好相等。

  • 下面結合具體實例來運用分布分析對定量數據進行特征分析。

    表3-2是菜品“撈起生魚片”在2014年第二個季度的銷售數據,繪制銷售量的頻率分布表、頻率分布圖,對該定量數據做出相應的分析。

    ▲表3-2 “撈起生魚片”的銷售情況

    1. 求極差

    極差=最大值-最小值=3960-45=3915

    2. 分組

    這里根據業務數據的含義,可取組距為500,則組數如下所示。

    組數=極差/組距=3915/500=7.83≈8

    3. 決定分點

    分布區間如表3-3所示。

    ▲表3-3 分布區間

    4. 繪制頻率分布直方表

    根據分組區間得到如表3-4所示的頻率分布表。

    • 其中,第1列將數據所在的范圍分成若干組段,其中第1個組段要包括最小值,最后一個組段要包括最大值。習慣上將各組段設為左閉右開的半開區間,如第一個組段為[0,500)。

    • 第2列組中值是各組段的代表值,由本組段的上限值和下限值相加除以2得到。

    • 第3列和第4列分別為頻數和頻率。

    • 第5列是累計頻率,是否需要計算該列數值視情況而定。

    ▲表3-4 頻率分布

    5. 繪制頻率分布直方圖

    若以2014年第二季度“撈起生魚片”這道菜每天的銷售額組段為橫軸,以各組段的頻率密度(頻率與組距之比)為縱軸,表3-4中的數據可繪制成頻率分布直方圖,如代碼清單3-3所示。

    • 代碼清單3-3 “撈起生魚片”的季度銷售情況

    import?pandas?as?pd import?numpy?as?np catering_sale?=?'../data/catering_fish_congee.xls'????????#?餐飲數據 data?=?pd.read_excel(catering_sale,names=['date','sale'])??#?讀取數據,指定“日期”列為索引bins?=?[0,500,1000,1500,2000,2500,3000,3500,4000] labels?=?['[0,500)','[500,1000)','[1000,1500)','[1500,2000)','[2000,2500)','[2500,3000)','[3000,3500)','[3500,4000)']data['sale分層']?=?pd.cut(data.sale,?bins,?labels=labels) aggResult?=?data.groupby(by=['sale分層'])['sale'].agg({'sale':?np.size})pAggResult?=?round(aggResult/aggResult.sum(),?2,?)?*?100import?matplotlib.pyplot?as?plt plt.figure(figsize=(10,6))?????#?設置圖框大小尺寸 pAggResult['sale'].plot(kind='bar',width=0.8,fontsize=10)??#?繪制頻率直方圖 plt.rcParams['font.sans-serif']?=?['SimHei']???????????????#?用來正常顯示中文標簽 plt.title('季度銷售額頻率分布直方圖',fontsize=20) plt.show()

    運行代碼清單3-3可得季度銷售額頻率分布直方圖,如圖3-3所示。

    ▲圖3-3 季度銷售額頻率分布直方圖

    02?定性數據的分布分析

    對于定性變量,常常根據變量的分類類型來分組,可以采用餅圖和條形圖來描述定性變量的分布,如代碼清單3-4所示。

    • 代碼清單3-4 不同菜品在某段時間的銷售量分布情況

    import?pandas?as?pd import?matplotlib.pyplot?as?plt catering_dish_profit?=?'../data/catering_dish_profit.xls'#?餐飲數據 data?=?pd.read_excel(catering_dish_profit)??#?讀取數據,指定“日期”列為索引#?繪制餅圖 x?=?data['盈利'] labels?=?data['菜品名'] plt.figure(figsize=(8,?6))??#?設置畫布大小 plt.pie(x,labels=labels)??#?繪制餅圖 plt.rcParams['font.sans-serif']?=?'SimHei' plt.title('菜品銷售量分布(餅圖)')??#?設置標題 plt.axis('equal') plt.show()#?繪制條形圖 x?=?data['菜品名'] y?=?data['盈利'] plt.figure(figsize=(8,?4))??#?設置畫布大小 plt.bar(x,y) plt.rcParams['font.sans-serif']?=?'SimHei' plt.xlabel('菜品')??#?設置x軸標題 plt.ylabel('銷量')??#?設置y軸標題 plt.title('菜品銷售量分布(條形圖)')#?設置標題 plt.show()??#?展示圖片

    餅圖的每一個扇形部分代表每一類型的所占百分比或頻數,根據定性變量的類型數目將餅圖分成幾個部分,每一部分的大小與每一類型的頻數成正比;條形圖的高度代表每一類型的百分比或頻數,條形圖的寬度沒有意義。

    運行代碼清單3-4可得不同菜品在某段時間的銷售量分布圖,如圖3-4和圖3-5所示。

    ▲圖3?4?菜品銷售量分布(餅圖)

    ▲圖3?5 菜品銷售量分布(條形圖)

    關于作者:張良均,資深大數據挖掘與分析專家、模式識別專家、AI技術專家。有10余年大數據挖掘與分析經驗,擅長Python、R、Hadoop、Matlab等技術實現的數據挖掘與分析,對機器學習等AI技術驅動的數據分析也有深入研究。

    本文摘編自《Python數據分析與挖掘實戰》(第2版),經出版方授權發布。

    延伸閱讀《Python數據分析與挖掘實戰》

    點擊上圖了解及購買

    轉載請聯系微信:DoctorData

    推薦語:暢銷書全新升級,第1版銷售超過10萬冊,被國內100余所高等院校采用為教材,同時被廣大數據科學工作者奉為經典,是該領域公認的事實標準。作者在大數據挖掘與分析等領域有10余年的工程實踐、教學和創辦企業的經驗,不僅掌握行業的最新技術和實踐方法,而且洞悉學生和老師的需求與痛點。

    劃重點????

    干貨直達????

    • 2020上半年,50萬大數據DT用戶最愛的10本書

    • 哪些數據庫是行存儲?哪些是列存儲?有什么區別?

    • 什么是數字化轉型?來自IBM、微軟、阿里的精華觀點和實踐

    • 6個維度、1個書單,解讀最近很火的數據產品經理是做什么的

    更多精彩????

    在公眾號對話框輸入以下關鍵詞

    查看更多優質內容!

    PPT?|?讀書?|?書單?|?硬核?|?干貨?|?講明白

    大數據?|?云計算?|?數據庫?|?Python?|?可視化?|?神操作

    AI?|?人工智能?|?機器學習?|?深度學習?|?神經網絡

    5G?|?中臺?|?用戶畫像?|?1024?|?大神?|?數學?|?揭秘

    據統計,99%的大咖都完成了這個神操作

    ????

    總結

    以上是生活随笔為你收集整理的手把手教你用直方图、饼图和条形图做数据分析(Python代码)的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 一级黄色网 | 中文字幕免费高清视频 | 日韩高清精品免费观看 | 男人的天堂视频在线观看 | 色噜噜综合网 | 青青草成人影视 | 涩涩视频在线观看免费 | 91精品视频免费看 | 久色网 | 国产明星换脸xxxx色视频 | 超碰在线香蕉 | 玖玖爱在线观看 | 日韩不卡在线视频 | 中文字幕av免费观看 | 久久午夜夜伦鲁鲁片 | 国产三级三级在线观看 | 欧美精品一区二区三区在线 | 青青草综合 | 日日噜噜夜夜狠狠久久波多野 | 久久久久久久久久久综合 | 日本电车痴汉 | 色婷婷精品国产一区二区三区 | 久久精品视频中文字幕 | 影音先锋亚洲精品 | 亚洲激情短视频 | 黄色在线观看免费视频 | 精品夜夜澡人妻无码av | 欧洲一级黄色片 | 日韩av专区| 国产视频在线观看视频 | 亚洲精品999| 亚洲欧美日本在线 | 亚洲AV无码精品一区二区三区 | 传媒视频在线观看 | 喷水了…太爽了高h | 最新中文在线视频 | 亚洲在线网站 | 日韩国产欧美在线视频 | 人妻换人妻a片爽麻豆 | 91麻豆一区二区 | 国产不卡av在线播放 | 亚洲人成无码网站久久99热国产 | 91成人在线免费视频 | a天堂中文在线 | 在线免费视频一区 | 欧美xxxxxxxxx| www,日韩| 香蕉视频入口 | 自拍亚洲欧美 | 成人区人妻精品一区 | 伊人久久伊人 | 亚洲欧洲精品一区二区三区 | 搞逼综合网 | 日日操夜夜操视频 | 国语对白做受xxxxx在线中国 | 欧美亚洲一区二区三区 | 日本一本在线 | 8ppav| 成年人在线免费观看网站 | 国产色在线视频 | 美女被艹视频网站 | 极品少妇网站 | 亚洲三级视频 | www日韩精品 | 无码国产精品久久一区免费 | 久久福利电影 | 成人福利视频网站 | 成人123区 | 成人在线观看一区 | 蜜桃av导航 | 欧美激情自拍偷拍 | 亚洲在线视频免费观看 | 欧美精品v| 男女羞羞无遮挡 | 最好看十大无码av | 欧美色图小说 | 天堂网在线最新版www中文网 | 人人妻人人澡人人爽精品日本 | 色婷婷一区二区 | 黄页视频在线观看 | 国产a久久麻豆入口 | 国产精品久久欧美久久一区 | 一区二区日韩 | 国产精品av久久久久久无 | 国产美女精品一区二区三区 | 黄色网在线免费观看 | 国产在线一卡二卡 | 亚洲性生活片 | 亚洲涩涩图 | 国产精品自拍一区 | 欧美精品一区三区 | 亚洲高清网站 | wwwav视频在线观看 | 日韩视频网站在线观看 | 国产夜夜嗨 | 日韩成人在线观看 | 色玖玖综合 | 女生扒开尿口 | 成人激情自拍 |