特征工程(1):特征提取、特征构建、特征选择的区别
? ? ? ? 特征對于預(yù)測而言是相當(dāng)重要的,在預(yù)測建模之前的大部分工作都是在尋找特征,沒有合適特征的預(yù)測模型,就幾乎等于瞎猜,對預(yù)測目標(biāo)而言沒冇任何意義。特征通常是指輸入數(shù)據(jù)中對因變量的影響比較明顯的有趣變量或?qū)傩浴?/p>
? ? ? ?常見的特征提取、特征構(gòu)建、特征選擇三個概念有著本質(zhì)不同:
? ? ? ?(1)特征提取:是指通過函數(shù)映射從原始特征中提取新特征的過程,假設(shè)有個原始特征(或?qū)傩?表示為,通過特征提取我們可以得到另外一組特征,表示為,其中,且是對應(yīng)的函數(shù)映射,注意到,這里我們用得到的新特征替代了原始特征,最終得到m個特征;
? ? ? (2)特征構(gòu)建:是從原始特征中推斷或構(gòu)建額外特征的過程,對于原始的個特征,經(jīng)過特征構(gòu)建,我們得到個額外的特征,表示為,所得到的這些特征都是由原始特征定義的,最終得到個特征。
? ? ? (2)特征選擇:是指從原始的個特征中選擇個子特征的過程,因此特征選擇按照某個標(biāo)準(zhǔn)實現(xiàn)了最優(yōu)簡化,即實現(xiàn)了降維,最終得到個特征(注意特征并沒有發(fā)生變化,只是總的數(shù)量減少了)。
? ? ? ??
?
總結(jié)
以上是生活随笔為你收集整理的特征工程(1):特征提取、特征构建、特征选择的区别的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 聚类算法(2):系统聚类/层次聚类算法
- 下一篇: 特征工程(2):特征构建