特征工程(part5)--分类型变量
生活随笔
收集整理的這篇文章主要介紹了
特征工程(part5)--分类型变量
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
學習筆記,僅供參考,有錯必究
文章目錄
- 分類型變量
- 分類型變量的編碼
- one-hot編碼
- 虛擬編碼
- 效果編碼
- 各種分類變量編碼的優(yōu)缺點
分類型變量
分類型變量的編碼
分類變量中的類別通常不是數(shù)值型,我們需要一種編碼方式將非數(shù)值型的類別轉換為數(shù)值,一般,我們很容易想到,簡單地為k個可能類別中的每個類別分配一個整數(shù),比如從1到k,但這樣會使類別彼此之間存在順序,這在分類變量中是不被允許的。
one-hot編碼
虛擬編碼
總結
以上是生活随笔為你收集整理的特征工程(part5)--分类型变量的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: TP-Link TL-WDR7500 V
- 下一篇: Django从理论到实战(part48)