二、数据预处理——缺失值处理
生活随笔
收集整理的這篇文章主要介紹了
二、数据预处理——缺失值处理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
二、數據預處理——缺失值處理
點擊標題即可獲取文章相關的源代碼文件喲!
機器學習和數據挖掘中所使用的數據,永遠不可能是完美的。很多特征,對于分析和建模來說意義非凡,但對于實際收集數據的人卻不是如此,因此數據挖掘之中,常常會有重要的字段缺失值很多,但又不能舍棄字段的情況。因此,數據預處理中非常重要的一項就是處理缺失值。
在這里,我們使用從泰坦尼克號提取出來的數據,這個數據有三個特征,一個數值型,兩個字符型,標簽也是字符型。從這里開始,我們就使用這個數據給大家作為例子,讓大家慢慢熟悉sklearn中數據預處理的各種方式。
- impute.SimpleImputer
在講解隨機森林的案例時,我們用這個類和隨機森林回歸填補了缺失值,對比了不同的缺失值填補方式對數據的影響。這個類是專門用來填補缺失值的。它包括四個重要參數:
總結
以上是生活随笔為你收集整理的二、数据预处理——缺失值处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 指令系统——数据存放、指令寻址(详解)
- 下一篇: html插入flash代码_初学者必备W