特征工程(3):特征选择
? ? ? ? 在建立模型之前,我們已經(jīng)按照特征構(gòu)建的方法得到了數(shù)據(jù)集,但是這樣的數(shù)據(jù)集可能存在大量的特征,特征之間可能存在相關(guān)性,也可能存在冗余特征,因此需對(duì)數(shù)據(jù)集進(jìn)行降維處理,以得到最優(yōu)子集,這個(gè)過(guò)程叫做特征選擇。
? ? ? ?特征選擇的常用方法通常可分為三類(lèi):直接法、單變量特征選擇、多變量特征選擇。
? ? ? ?1. 直接法
? ? ? ?2. 單元法
? ? ? ? ? ?2.1 相關(guān)系數(shù)
? ? ? ? ? ?2.2 信息增益
? ? ? ? ? ?2.3 Gini系數(shù)
? ? ? ? ? ?2.4 單因素方差分析
? ? ? ? ? ?2.5 卡方檢驗(yàn)
? ? ? ?3. 多元法
? ? ? ? ? ?3.1 逐步回歸
? ? ? ? ? ?3.2 隨機(jī)森林
? ? ? ? ? ?3.3 遺傳算法
單元法:即單變量,對(duì)每個(gè)特征依次進(jìn)行評(píng)價(jià),然后把不滿足要求的排除,以達(dá)到特征選擇的目的。
多元法:即多變量,一次針對(duì)多個(gè)變量,通過(guò)評(píng)價(jià)各個(gè)組合的得分,最終選擇最優(yōu)的特征組合,作為多變量特征選擇的結(jié)果。
總結(jié)
以上是生活随笔為你收集整理的特征工程(3):特征选择的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 卡尔曼滤波器算法(Kalman Filt
- 下一篇: 特征工程(3):特征选择—信息增益