日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

异常值检验的方法

發布時間:2023/12/19 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 异常值检验的方法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

鄙人學習筆記
參考文獻:《計量經濟學模型及R語言應用》-王斌會


文章目錄

    • 異常值檢驗的方法
      • 原始殘差檢測方法
      • 杠桿值檢測方法
      • 學生化殘差檢測方法


異常值檢驗的方法

對于單變量線性回歸,異常值的檢測很簡單,只需在直角坐標上作出散點圖就能很直觀地識別出哪些是異常值。
在多元線性回歸中,特別是樣本容量較大時,檢測的方法就復雜多了。一般來說,作出矩陣散點圖對發現異常值有一定的幫助,但是散點圖只能反映變量兩兩之間的關系,所以并不是一個很好的辦法。常用的辦法是通過檢測各類殘差來發現異常值。

原始殘差檢測方法


當樣本數據本身對模型影響足夠大時,會使模型盡可能地向自己身邊靠攏,所以盡管該樣本的殘差并不會很大,但是模型的擬合程度已經減小。因此,除了原始殘差方法外,還需要其他方法來輔助。

杠桿值檢測方法


可以看出,假定的隨機誤差項是同方差的,但是殘差的方差卻不是相等的。它與H矩陣主對角線上的值密切相關。當hi的值很大時(比如接近于1),殘差的方差會很小。反映在圖形上,顯示為該樣本把回歸直線向自己身邊拉近,從而對整個模型的擬合性造成很大影響,所以對于hi值特別大的樣本,一般判定界限為2p/n(注意:這里的p需包含常數項)。這時,我們稱大于2p/n的點為高杠桿值點

學生化殘差檢測方法

殘差的重要應用之一是根據它的絕對值大小判定異常值。但是普通殘差有var(ei)=(1-hi)*σ2,這個方差與因變量y的度量單位以及hi有關。因此在判定異常點的情形時,直接比較一般殘差是不合適的,需要對其進行標準化,得到學生化殘差:

可以證明cov(ri, rj)一般很小,所以應用上常常近似的認為ri, rj不相關,并進一步用正態分布作為ri的近似分布,即ri近似服從N(0, 1)分布且相互獨立。
當|ri| > 3時,可認為第i個點為異常點。

總結

以上是生活随笔為你收集整理的异常值检验的方法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。