日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python异常值处理箱型图_如何利用python处理异常值?

發布時間:2025/3/15 python 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python异常值处理箱型图_如何利用python处理异常值? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在數據清洗階段,我們需要找到異常值,并對其進行相應的一些處理。在python中,異常值的處理常常需要結合一些數據模型或概率分布來解決。下面做一個簡單的介紹。

1.打開pycharm開發工具,在運行窗口輸入命令:

import pandas as pd #導入pandas庫

2.輸入數據集。

data=pd.DataFrame({'name':['A','B','C','D','E','F','G'],'cost':[2,127,4,6,3,13,14],'sales':[13,18,32,54,23,33,44]})

print(data)

3.通過z-score方法判斷異常值,即對原始值X進行正態標準化:(X-mean(X))/std(X),根據計算的結果判斷樣本值與中心的偏離程度。

df1=data.copy()#為了不影響原始數據集,復制數據集data

print(df1)

4.按列計算均值和標準差。

df1['cost']=(df1['cost']-df1['cost'].mean())/df1['cost'].std()#標準化cost_z列

5.對sales列進行標準化。

df1['sales']=(df1['sales']-df1['sales'].mean())/df1['sales'].std()#標準化cost_z列

df1['sales']

6.查看標準化后的數據集。

print(df1)

標準化后的絕對值越大,數據越有可能異常,是否異常根據設定的閾值判斷。

7.假設cost列閾值為2,通過下面的方法找到異常值。

df1['cost'].abs()>2#判斷數據是否異常

data[df1['cost'].abs()>2]#取出原數據集中的異常點

?

總結

以上是生活随笔為你收集整理的python异常值处理箱型图_如何利用python处理异常值?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。