OA(part1)
學習筆記,僅供參考,有錯必糾
機翻,建議看英文原著
An Introduction to Outlier Analysis
Introduction
離群點是與剩余數據顯著不同的數據點。霍金斯定義[249]一個異常值如下:“離群值是一種與其他觀察值偏差太大的觀察值,以至于讓人懷疑它是由不同的機制產生的。”
在數據挖掘和統計文獻中,異常值也被稱為異常、不協調、異常或異常。在大多數應用程序中,數據是由一個或多個生成過程創建的,這些流程可以反映系統中的活動或收集到的關于實體的觀察結果。當生成過程的行為異常時,它會導致異常值的產生。因此,離群值通常包含有關影響數據生成過程的系統和實體的異常特征的有用信息。對這些不尋常特征的識別提供了有用的應用特定的見解。
舉例如下:
- Intrusion detection systems:在許多計算機系統中,收集關于操作系統調用、網絡流量或其他用戶動作的不同類型的數據。由于惡意活動,這些數據可能會顯示異常行為。對這種活動的識別被稱為入侵檢測;
- Credit-card fraud:信用卡欺詐變得越來越普遍,因為信用卡號碼等敏感信息更容易被泄露。在許多情況下,未經授權使用信用卡可能會表現出不同的模式,如從特定地點瘋狂購物或非常大的交易。這種模式可以用來檢測信用卡交易數據中的異常值。
- Interesting sensor events:在許多實際應用中,傳感器通常用于跟蹤各種環境和位置參數。潛在模式的突然變化可能代表感興趣的事件。事件檢測是傳感器網絡領域的主要應用之一。正如本書后面所討論的,事件
總結
- 上一篇: 文献记录(part75)--基于最大平均
- 下一篇: OA(part2)--Outlier E