日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

统计学---极端异常值的检测

發布時間:2025/3/20 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 统计学---极端异常值的检测 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

你在整理統計公司人的收入情況,手一抖,不小心把某個人的月薪26249變成262490了,某個人的月薪16895變成1689.5了。于是變成了如下的情況:

incomes=[25590, 23306, 26780, 29463, 22485, 262490, 24985, 1689.5, 17700, 18257, 24132, 21479, 19304, 16511, 18573, 26606, 20917, 19394, 24322, 28383, 16478, 29062, 23232, 17580, 26804, 28500, 25018, 24001, 27530, 27459, 22776, 19835, 16475, 15201, 28801, 19509, 19098, 17993, 15131, 26187, 25022, 27430, 19114, 18295, 25365, 23550, 20413, 19335, 21286, 22911]

有時候數據集中會包含一個或多個數值異常大或異常小的值,這樣的極端值稱為異常極端值(outlier)。這在現實數據集中是很有可能發生的,如數據錄入錯誤、測量錯誤、試驗錯誤、數據處理錯誤等。異常值的存在當然對數據統計產生很多不良的影響,例如降低數據統計的說服力和可信度。

因此,我們首先想到的是把異常值檢測出來。這里就需要用到排序,利用排序,將數據從小到大進行排列。然后將數據進行等分。如果分成2部分,那這個數就是中位數。如果分為4部分,那這個數就叫四分位數。注意,這不是美式足球(橄欖球)中的四分位;四分位數不止一個,是3個,即通過3個四分位數將數據分為了4個數量上相等的部分。

這3個四分位數分別用Q1,Q2,Q3表示。你可能并不陌生,股票市場中,經常有Q1財報,Q2財報,Q3財報,Q4財報的說法,指的是四個季度的財報情況,一年4個季度,也是四等分。

那么,對于上面的數據,怎樣計算Q1,Q2,Q3呢?可以利用pandas的describe函數。

import pandas as pd four = pd.Series(data).describe() print(four) print('Q1= {0}, Q2= {1}, Q3={2}'.format(four['25%'],four['50%'],four['75%']))

輸出結果:

count 50.000000 mean 26835.150000 std 34372.619505 min 1689.500000 25% 19102.000000 50% 22843.500000 75% 26037.750000 max 262490.000000 dtype: float64 Q1= 19102.0, Q2= 22843.5, Q3= 26037.75

可以看出,pandas的describe函數不僅能得出數據集的樣本數量,均值,標準差,最小值、最大值,以及3個四分位數,即在數據25%,50%,75%位置的數。我們通常把Q3-Q1的差值稱為四分位距(interquartile range,IQR),或四分差

那什么是異常極端值呢,用如下計算公式:

Q1 = four['25%'] Q3 = four['75%'] IQR = Q3 - Q1upper = Q3 + 1.5 * IQR lower = Q1 - 1.5 * IQRprint(upper, lower)

輸出結果:

36441.375 8698.375

高于upper或者低于lower的值都屬于異常極端值。

畫出圖像如下:

incomes = pd.DataFrame(incomes) import seaborn as sns import matplotlib.pyplot as pltsns.boxplot(data=incomes, palette="Set1") plt.show()


很容易發現標為黑色菱形的這2個極端值。那這個計算極端值的1.5是怎么得來的呢,這是統計學中經過大量分析和經驗積累得出的標準,一般情況不做調整。

總結

以上是生活随笔為你收集整理的统计学---极端异常值的检测的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 精品一区二区久久久久蜜桃 | 国产日韩欧美二区 | 午夜精品福利视频 | 美女视频黄免费 | 国产精品一线二线三线 | 国产精品亚洲二区 | 白丝动漫美女 | 国产 一二三四五六 | 绿帽在线 | 色一情一区二区三区 | 亚洲天堂一级片 | 一卡二卡三卡 | 六月综合| 91久久精品国产91性色tv | 天躁夜夜躁狼狠躁 | 国产精品中文在线 | 欧美激情亚洲综合 | 日韩中文字 | 免费大片在线观看www | 青青青手机视频在线观看 | 日本精品一区二区三区视频 | 狠狠搞视频 | 色婷婷国产精品 | 美女黄色录像 | 国产精品色悠悠 | 六月婷婷激情 | 久久久久国色av免费观看性色 | 琪琪色网 | 成人涩涩视频 | 国产成人精品在线视频 | 成色视频| 欧美丰满艳妇bbwbbw | 欧美三级视频在线观看 | 一区二区日本 | 91ts人妖另类精品系列 | 日日碰碰 | 视频一区二区国产 | 制服丝袜av一区二区三区下载 | 在线观看日韩 | 91精品国产电影 | 福利在线视频导航 | 人人操在线播放 | h片在线播放 | 成人精品网 | 猛1被调教成公厕尿便失禁网站 | 久久伊人超碰 | 久草aⅴ | 无码专区久久综合久中文字幕 | 免费国产一区二区 | 亚洲男女网站 | 国产精品久久在线观看 | 欧美又粗又大xxxxbbbb疯狂 | 9l视频自拍九色9l视频 | 亚洲天堂美女 | 欧美高清一区二区 | 精品国产精品三级精品av网址 | 日欧一级片| 人妻视频一区二区三区 | 精品孕妇一区二区三区 | 男女性生活视频网站 | 日韩小视频网站 | 多啪啪免费视频 | 999久久久国产精品 韩国精品一区二区 | 狼人综合av | 888奇米影视| 男人都懂的网址 | 亚色中文 | 精品精品精品 | 朴银狐电影中文在线看 | 国产黄色在线播放 | 久草福利视频 | 国产精品无码电影在线观看 | 综合久久久久久 | 亚洲人视频 | 亚洲欧洲精品一区二区三区 | 亚洲第一看片 | 成年男女免费视频网站 | 国产精品亚洲AV色欲三区不卡 | 男女激情啪啪 | 成人性生交大片 | 天天摸天天做天天爽水多 | 久久久999成人| 开心激情播播网 | 国产精品探花一区二区在线观看 | 日本熟妇乱子伦xxxx | 91久久国产综合久久91精品网站 | 亲吻刺激视频 | 丰满女人又爽又紧又丰满 | 国产精品第56页 | 国产九九热 | 懂色av色吟av夜夜嗨 | 日日日干干干 | 九色91| 亚洲综合色av| 中文字幕在线免费看 | 日本不卡一区在线观看 | 少妇高潮久久久 | 91久久在线观看 | 国产成人精品无码免费看夜聊软件 |