R: 判别分析
判別與聚類的比較:
聚類分析和判別分析有相似的作用,都是起到分類的作用。
判別分析是已知分類然后總結出判別規則,是一種有指導的學習;
聚類分析則是有了一批樣本,不知道它們的分類,甚至連分成幾類也不知道,希望用某種方法把觀測進行合理的分類,使得同一類的觀測比較接近,不同類的觀測相差較多,這是無指導的學習。
????所以,聚類分析依賴于對觀測間的接近程度(距離)或相似程度的理解,定義不同的距離量度和相似性量度就可以產生不同的聚類結果
判別分析
基本原理:從已知的各種分類情況中總結規律(訓練出判別函數),當新樣品進入時,判斷其與判別函數之間的相似程度(概率最大,距離最近,離差最小等判別準則)。
常用判別方法:最大似然法,Bayes判別法,距離判別法,Fisher判別法,逐步判別法等。
注意事項:1. 判別分析的基本條件:分組類型在兩組以上,解釋變量必須是可測的;
??????????2. 每個解釋變量不能是其它解釋變量的線性組合(比如出現多重共線性情況時,判別權重會出現問題);
??????????3. 各解釋變量之間服從多元正態分布(不符合時,可使用Logistic回歸替代),且各組解釋變量的協方差矩陣相等(各組協方方差矩陣有顯著差異時,判別函數不相同)。
相對而言,即使判別函數違反上述適用條件,也很穩健,對結果影響不大。
應用領域:對客戶進行信用預測,尋找潛在客戶(是否為消費者,公司是否成功,學生是否被錄用等等),臨床上用于鑒別診斷。
?
?本文中分三個方法介紹判別分析,Bayes判別,距離判別,Fisher判別。
Bayes 和 距離判別:都要考慮兩個、或多個總體協方差(方差是協方差的一種)相等或不等的情況,由 var.equal= 的邏輯參數表示,默認是 FALSE,表示認為兩總體協方差不等。
用樣本的協方差可以估計總體的協方差。
在Bayes方法中我們把相等和不等的兩個結果都列了出來,距離判別里我們默認兩總體協方差不等。
一般使用時,我們都以兩總體的協方差不等作為標準來進行后續計算。
?Bayes判別
Bayes判斷 假定我們對研究對象有一定的認識,這種認識常用先驗概率來描述。。。
取得樣本后,用樣本來修正已有的先驗概率分布,得出后延概率分布。。
再通過后驗分布進行各種統計推斷。。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
參考文獻:
https://blog.csdn.net/zhubo22/article/details/8194772? ?總述 聚類與判別之間的關系
https://blog.csdn.net/tiaaaaa/article/details/58145126? 判別分析的實例與原理。
https://blog.csdn.net/chen790646223/article/details/45450301? 各種判別和分類方法。
轉載于:https://www.cnblogs.com/li-20151130/p/9114249.html
總結
- 上一篇: 重装系统后需要安装的软件
- 下一篇: 7、Node.js EventEmitt