Matlab中特征选择reliefF算法使用方法(分类与回归)
生活随笔
收集整理的這篇文章主要介紹了
Matlab中特征选择reliefF算法使用方法(分类与回归)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. ReliefF簡介
ReliefF是特征選擇的一種算法,在高維特征樣本中,選取部分具有代表性的特征,從而降低樣本特征維度。它也是relief算法的進階。Relief算法只能用來做二分類,但其算法簡單,效率高,結果不錯,因此才有了其進階算法ReliefF。ReliefF不僅可以完成多分類任務,也可以勝任回歸任務。
2. relieff()函數
示例:
[ranks,weights] = relieff(X,y,k) [ranks,weights] = relieff(X,y,k,Name,Value)(1)輸入參數
- X:樣本數據集
- y:與X對應的樣本標簽
- k:一個超參數,relieff中用到了KNN最近鄰算法,k為同類樣本最近鄰的數量。需要根據不同數據處理情況調整參數
- Name:一些拓展設置,一般不常用,詳細可看matlab文檔,其中‘method’比較常用,用來選擇是做回歸還是分類任務
- Value:為Name的值,‘method’對應的Value為’regression’或’classification’,對應的“回歸”或分類
(2)輸出參數
- ranks:對各個維度特征按照重要程度排序,例如ranks = [3,1,2],表示第3個維度最重要,第1個維度其次,第2個維度最不重要
- weights:原樣本每個維度的重要權重,例如:weights = [0.5,0.1,0.4],表示第一個維度權重為0.5,最重要,第二個維度權重0.1,最不重要,第三個為0.4,第二重要
3. relieff()函數做分類任務特征選擇
示例代碼:
load fisheriris%matlab中自帶的數據集 [ranks,weights] = relieff(meas,species,10,'method','classification')結果如下:表示第4維度特征和第3維度特征權重較大,因此我們就可以取原數據中第4維度數據和第3維度數據用于分類,其余丟棄,將4維數據降到了2維
@注意@:標簽是數字,函數會默認用于回歸。如果想要標簽是數字,但想用于分類,就需要加上‘method’,‘classification’;否則,函數會默認用于回歸。上述例子中使用的species是字符串,因此默認用于分類,可以不需要加’method’,‘classification’。
4. relieff()函數做回歸任務特征選擇
%針對回歸任務數據集,只需要將分類任務中的classification換成regression即可 [ranks,weights] = relieff(meas,species,10,'method','regression')總結
以上是生活随笔為你收集整理的Matlab中特征选择reliefF算法使用方法(分类与回归)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 临时文件_Go语言学习基础-文件路径、目
- 下一篇: 不恢复余数除法原理_青岛版二年级下册数学