四、数据预处理——处理连续型特征:二值化与分段
生活随笔
收集整理的這篇文章主要介紹了
四、数据预处理——处理连续型特征:二值化与分段
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
四、數(shù)據(jù)預(yù)處理——處理連續(xù)型特征:二值化與分段
點(diǎn)擊標(biāo)題即可獲取文章相關(guān)的源代碼文件喲!
- sklearn.preprocessing.Binarizer
根據(jù)閾值將數(shù)據(jù)二值化(將特征值設(shè)置為0或1),用于處理連續(xù)型變量。大于閾值的值映射為1,而小于或等于閾值的值映射為0。默認(rèn)閾值為0時(shí),特征中所有的正值都映射到1。二值化是對(duì)文本計(jì)數(shù)數(shù)據(jù)的常見操作,分析人員可以決定僅考慮某種現(xiàn)象的存在與否。它還可以用作考慮布爾隨機(jī)變量的估計(jì)器的預(yù)處理步驟(例如,使用貝葉斯設(shè)置中的伯努利分布建模)。
- preprocessing.KBinsDiscretizer
這是將連續(xù)型變量劃分為分類變量的類,能夠?qū)⑦B續(xù)型變量排序后按順序分箱后編碼??偣舶齻€(gè)重要參數(shù):
總結(jié)
以上是生活随笔為你收集整理的四、数据预处理——处理连续型特征:二值化与分段的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 五、手动取消ajax请求 解决重复发送
- 下一篇: Web框架——Flask系列之json、