机器学习之数据预处理——数据清洗(缺失值、异常值和重复值的处理)
生活随笔
收集整理的這篇文章主要介紹了
机器学习之数据预处理——数据清洗(缺失值、异常值和重复值的处理)
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
機(jī)器學(xué)習(xí)之?dāng)?shù)據(jù)預(yù)處理——數(shù)據(jù)清洗缺失值、異常值和重復(fù)值的處理
- 基礎(chǔ)知識(shí)
- 技術(shù)點(diǎn)總結(jié)
- 數(shù)據(jù)列缺失的處理方法
- 1、丟棄(缺失值處理)
- 1、生成一份隨機(jī)數(shù)據(jù)
- 2、查看哪些值缺失
- 3、獲得含有NA的列
- 4、獲取全部為NA的列
- 5、丟棄缺失值
- 2、補(bǔ)全(缺失值處理)
- 1、使用sklearn將缺失值替換為特定值
- 使用這一列的均值代替NaN
- 使用這一列的中位數(shù)代替NaN
- 使用這一列的眾數(shù)代替NaN
- 2、使用Pandas將缺失值替換為特定值
- 用后面的值替換缺失值
- 用后面的值替換缺失值,限制每列只能替換一個(gè)缺失值
- 用前面的值替換缺失值
- 用0替換缺失值
- 用不同值替換不同列的
總結(jié)
以上是生活随笔為你收集整理的机器学习之数据预处理——数据清洗(缺失值、异常值和重复值的处理)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 全球首个商用海底数据中心成功下水安装 重
- 下一篇: 机器学习之数据预处理——归一化,标准化