无监督特征选择算法综述
生活随笔
收集整理的這篇文章主要介紹了
无监督特征选择算法综述
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
無監督特征選擇算法
Filter方法
只使用數據的內在屬性,不使用聚類等其他輔助方法
速度快
單變量
Information based methods
- 基于距離相似度的熵值作為指標,進行相關性排序,選擇特征
- 過其奇異值來測量原始數據矩陣的熵,評估每個特征對熵的貢獻,并根據它們各自的熵值對特征進行排序。
- 三種選擇最終特征子集的不同方法:簡單排序、向前選擇和向后消除
- 表示熵是數據集中信息壓縮的一種度量
Spectral-similarity based methods
拉普拉斯評分。在拉普拉斯算子中,特征的重要性通過其方差和局部保持能力來評估,在拉普拉斯算子中,特征的重要性通過其方差和局部保持能力來評估。
多變量
Statistical/information based methods
- 將原始特征集劃分成簇,使得同一簇中的特征高度相似,而不同簇中的特征不相似
- 計算每個特征的k-NN特征。然后,選擇具有最緊湊子集的特征,并且丟棄其k-NN最近特征
- 該方法分兩步選擇特征。在該方法中,首先,根據相關性度量對特征進行排序。然后,在第二步中,按照在前一步中生成的順序,使用特征相似性度量來評估特征,以量化它們之間的冗余度。之后,選擇冗余度最低的前p個特征。
Bio-inspired methods
- 遺傳算法優先選擇高信息素值和低相似性,直到達到預先指定的停止標準(迭代次數)。最后,選擇那些具有最高信息素值的特征
tion)
ACO)
Spectral/sparse learning methods
- 結合SPEC排序和最小冗余最優性準則的特征選擇方法
- 該方法利用對象之間的相似性,將線性判別分析(LDA)擴展到無監督情況(LLDA)。其思路是遞歸地刪除LLDA判別向量絕對值最小的特征,以識別可能揭示樣本中聚類的特征。
- 通過同時利用離散矩陣和特征相關性中包含的判別信息進行特征選擇。
- 同時實現魯棒聚類和魯棒特征選擇。
Wrapper方法
使用聚類算法評估特征子集
計算量較大
Sequential methods
Bio-inspired methods
- 一種基于k-means和高斯混合聚類算法的進化局部選擇算法,來搜索特征子集和聚類數目
Iterative
LLC-fs (Local Learning-based Clustering algorithm with feature selection)
EUFS (Embedded Unsupervised Feature Selection)
- 通過稀疏學習將特征選擇直接嵌入到聚類算法中
DGUFS (Dependence Guided Unsupervised Feature Selection)
Hybrid方法
綜合上面兩種方法,在計算速度和模型效果之間做一個折衷
- 該方法從包裝器階段開始,通過在用戶指定的集群范圍內的數據集上運行kmeans聚類算法。采用簡化輪廓準則對聚類進行評價,并選取值最高的聚類。隨后,在濾波階段,利用馬爾可夫方法,通過貝葉斯網絡選擇一個特征子集
常用用于分類和聚類的特征選擇方法
不同領域的特征選擇算法應用
總結
以上是生活随笔為你收集整理的无监督特征选择算法综述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 特征选择算法-Relief
- 下一篇: java8