sklearn数据预处理
生活随笔
收集整理的這篇文章主要介紹了
sklearn数据预处理
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
@Author : By Runsen
文章目錄
- 預(yù)處理數(shù)據(jù)
- 映射到統(tǒng)一分布
- 標(biāo)準(zhǔn)化,或平均刪除和方差縮放
- 數(shù)據(jù)的正則化(正則化有時(shí)也叫歸一化)
- 特征的二值化
- 怎么設(shè)置閾值
- 分類(lèi)特征編碼
- 有丟失的分類(lèi)特征值處理
- 處理缺失值
- pandas方法
- sklearn 方法
- 生成多項(xiàng)式特征
預(yù)處理數(shù)據(jù)
數(shù)據(jù)預(yù)處理(data preprocessing)是指在主要的處理以前對(duì)數(shù)據(jù)進(jìn)行的一些處理。
預(yù)處理數(shù)據(jù)包括
- 數(shù)據(jù)的標(biāo)準(zhǔn)化
- 數(shù)據(jù)的歸一化
- 數(shù)據(jù)的二值化
- 非線性轉(zhuǎn)換
- 數(shù)據(jù)特征編碼
- 處理缺失值等
該sklearn.preprocessing軟件包提供了幾個(gè)常用的實(shí)用程序函數(shù)和變換器類(lèi),用于將原始特征向量更改為更適合下游估計(jì)器的表示。
總結(jié)
以上是生活随笔為你收集整理的sklearn数据预处理的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。