数据预处理——数据清洗、异常值与重复数据的检测
生活随笔
收集整理的這篇文章主要介紹了
数据预处理——数据清洗、异常值与重复数据的检测
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
數據預處理(Data Preprocessing)
Where are data from?
Why Data Preprocessing?
How to handle missing data?
Outliers
? ? ? ? ? ? ??
注:異常點(Anomaly) vs. 離群點(Outlier)是不一樣的
怎么分析離群點(Local Outlier Factor)—— 用相對的關系
處理重復的數據(Duplicate Data)
方法一:用滑動窗口去做
方法二:找兩者關鍵的相同點
總結
以上是生活随笔為你收集整理的数据预处理——数据清洗、异常值与重复数据的检测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 以不同的维度去看待问题
- 下一篇: 离群点检测算法——LOF(Local O