當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

PAC—主成分分析方法

發(fā)布時(shí)間：2024/3/12 编程问答 44 豆豆

生活随笔收集整理的這篇文章主要介紹了 PAC—主成分分析方法小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

一.PAC方法引入與介紹

?（1）PAC 引入

???如圖1所示：

圖1.PAC 方法簡(jiǎn)介

?（2）PAC 基本思想

???如圖2所示：

圖2.PAC 方法基本思想

?（3）PAC 求解步驟

???【1】原始數(shù)據(jù)標(biāo)準(zhǔn)化處理
???【2】計(jì)算樣本相關(guān)系數(shù)矩陣
???【3】計(jì)算相關(guān)系數(shù)矩陣 R的特征值和相應(yīng)的特征向量
???【4】選擇主成分
???【5】計(jì)算主成分得分
???【6】依據(jù)主成分得分對(duì)問題分析與建模

圖3.PAC 方法詳細(xì)步驟

?（4）PAC 方法的作用與利弊

???如圖4所示：

圖4.PAC 方法的優(yōu)與劣

二.PAC方法求解實(shí)例

?（1）案例問題

???如圖5所示：

圖5.問題背景與數(shù)據(jù)

?（2）求解代碼

???如下所示：

%== PCA stepping demonstration program==%% Read data from a file (e.g. excel) and place it in a matrix. A=xlsread('Coporation_evaluation.xlsx', 'B2:I16');% Transfer orginal data to standard data a=size(A,1); % Get the row number of A b=size(A,2); % Get the column number of A for i=1:bSA(:,i)=(A(:,i)-mean(A(:,i)))/std(A(:,i)); % Matrix normalization end% Calculate correlation matrix of A. CM=corrcoef(SA);% Calculate eigenvectors and eigenvalues of correlation matrix. [V, D]=eig(CM);% Get the eigenvalue sequence according to descending and the corrosponding % attribution rates and accumulation rates. for j=1:bDS(j,1)=D(b+1-j, b+1-j); end for i=1:bDS(i,2)=DS(i,1)/sum(DS(:,1));DS(i,3)=sum(DS(1:i,1))/sum(DS(:,1)); end % Calculate the numvber of principal components. T=0.9; % set the threshold value for evaluating information preservation level. for K=1:bif DS(K,3)>=TCom_num=K;break;end end% Get the eigenvectors of the Com_num principal components for j=1:Com_numPV(:,j)=V(:,b+1-j); end% Calculate the new socres of the orginal items new_score=SA*PV;for i=1:atotal_score(i,2)=sum(new_score(i,:));total_score(i,1)=i; end new_score_s=sortrows(total_score,-2);% Displays result reports disp('特征值及貢獻(xiàn)率：') DS disp('閥值T對(duì)應(yīng)的主成分?jǐn)?shù)與特征向量：') Com_num PV disp('主成分分?jǐn)?shù)：') new_score disp('主成分分?jǐn)?shù)排序：') new_score_s

三.PAC方法總結(jié)

?（1）詳細(xì)講述步驟：

? ? ?【1】由于原始數(shù)據(jù)的數(shù)量級(jí)（量綱）常常不同，所以我們首先要對(duì)不同的變量類型進(jìn)行標(biāo)準(zhǔn)化，消除量綱的影響。具體就是每個(gè)值減去該變量類型均值然后除以該變量類型的標(biāo)準(zhǔn)差。
? ? ?【2】計(jì)算樣本相關(guān)系數(shù)矩陣就直接是按照?qǐng)D6方式求解即可，圖3中公式有誤。

圖6.求協(xié)方差

? ? ?【3】計(jì)算相關(guān)系數(shù)矩陣R的特征值和相應(yīng)的特征向量。使用函數(shù)可直接求得[V,D]。矩陣V是一列列的特征向量，而D是對(duì)角矩陣，對(duì)角線上的值就是特征值，并且特征值是由小到大排序的（越往右下）。
? ? ?【4】將特征值由大到小排序，然后計(jì)算貢獻(xiàn)度和累計(jì)貢獻(xiàn)度：貢獻(xiàn)度=特征值/特征值之和；累計(jì)貢獻(xiàn)度=從第一行到此行特征值之和/總特征值之和。
? ? ?【5】設(shè)定閾值，選擇主成分（特征值和對(duì)應(yīng)的特征向量）。規(guī)定閾值T是主成分需要累計(jì)的貢獻(xiàn)度。當(dāng)累計(jì)貢獻(xiàn)度大于等于T即完成特征值的選擇。
? ? ?【6】翻轉(zhuǎn)得到主成分包含的特征值對(duì)應(yīng)的特征向量。將標(biāo)準(zhǔn)化矩陣映射到主成分上。計(jì)算每一組得分：得分=每一行主成分得分之和。就得到了原始數(shù)據(jù)在主成分（降維）上的得分。

%讀取數(shù)據(jù) A=xlsread('Coporation_evaluation.xlsx', 'B2:I16');%獲得A的行數(shù)和列數(shù) a=size(A,1); b=size(A,2); for i=1:b%A矩陣標(biāo)準(zhǔn)化處理為SA：（每一個(gè)值-該列平均值）/該列標(biāo)準(zhǔn)差SA(:,i)=(A(:,i)-mean(A(:,i)))/std(A(:,i)); end%獲得標(biāo)準(zhǔn)化矩陣SA的相關(guān)系數(shù)矩陣 CM=corrcoef(SA);%獲得相關(guān)系數(shù)矩陣的特征值D和對(duì)應(yīng)的特征向量V [V, D]=eig(CM);%將特征值從大到小排序 for j=1:bDS(j,1)=D(b+1-j, b+1-j); end for i=1:b%計(jì)算貢獻(xiàn)度（貢獻(xiàn)度=特征值/特征值之和）DS(i,2)=DS(i,1)/sum(DS(:,1));%計(jì)算累計(jì)貢獻(xiàn)度（累計(jì)貢獻(xiàn)度=從第一行到此行特征值之和/總特征值之和）DS(i,3)=sum(DS(1:i,1))/sum(DS(:,1)); end %選擇主成分（特征值） T=0.9; for K=1:b%規(guī)定T是主成分需要累計(jì)的貢獻(xiàn)度%當(dāng)累計(jì)貢獻(xiàn)度大于等于T即完成特征值的選擇（由D(1,1)到D（Com_num,1））if DS(K,3)>=TCom_num=K;break;end end%因?yàn)橹皩⑻卣髦捣崔D(zhuǎn)（從函數(shù)返回的默認(rèn)從小到大返回為從大到小），而每個(gè)特征值對(duì)應(yīng)的特征向量也應(yīng)該是“逆對(duì)應(yīng)”關(guān)系 %獲得主成分特征值對(duì)應(yīng)的特征向量（特征值由1到Com_num,特征向量由到倒數(shù)第一到倒數(shù)第Com_num） for j=1:Com_numPV(:,j)=V(:,b+1-j); end%將標(biāo)準(zhǔn)化矩陣映射到主成分上（降維）獲得主成分得分矩陣(標(biāo)準(zhǔn)化消除量綱+主成分映射降維)new_score new_score=SA*PV;%計(jì)算得分 for i=1:a%得分=每一行主成分得分之和total_score(i,2)=sum(new_score(i,:));%設(shè)置序號(hào)total_score(i,1)=i; end %按照第二列進(jìn)行排序。負(fù)整數(shù)表示排序順序?yàn)榻敌颉?new_score_s=sortrows(total_score,-2);disp('特征值及貢獻(xiàn)率：') DS disp('閥值T對(duì)應(yīng)的主成分?jǐn)?shù)與特征向量：') Com_num PV disp('主成分分?jǐn)?shù)：') new_score disp('主成分分?jǐn)?shù)排序：') new_score_s

?（2）意義分析：

? ? ?【1】PCA主成分分析方法：
? ? ? ?針對(duì)于：多個(gè)變量存在一定相關(guān)性時(shí)；
? ? ? ?適用于：變量個(gè)數(shù)較多或者變量之間存在復(fù)雜的關(guān)系時(shí)；
? ? ? ?作用是：消除評(píng)價(jià)指標(biāo)間的相關(guān)影響（如果互相有關(guān)聯(lián)關(guān)系，則都評(píng)價(jià)肯定是不合理不客觀不公正的，關(guān)聯(lián)性越強(qiáng)越不合理PAC作用越強(qiáng)）。可減少指標(biāo)選擇工作量（減少指標(biāo)個(gè)數(shù)）。
? ? ?【2】案例作用分析：
? ? ? ?企業(yè)的各個(gè)評(píng)價(jià)指標(biāo)之間明顯是有關(guān)聯(lián)的。所以直接標(biāo)準(zhǔn)化然后計(jì)算得分是不合理的。主成分分析法就提取出互不相關(guān)的變量（維度），然后標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行映射，提取出主成分來(lái)評(píng)價(jià)。作用：（主要）是消除了指標(biāo)之間的相關(guān)影響，（次要）是減少了變量個(gè)數(shù)減少了計(jì)算。

四.函數(shù)解釋和參考文案

?（1）函數(shù)解釋：

???【1】std(A)：求向量A的標(biāo)準(zhǔn)差。
???【2】mean(A)：求矩陣A的平均值。
???【3】corrcoef(A)：求矩陣A的相關(guān)系數(shù)矩陣。
???【4】eig(A)=[V,D]：求矩陣A的全部特征值，構(gòu)成對(duì)角陣D，并求A的特征向量構(gòu)成V的列向量。
???【5】 sortrows (X, COL)：按指定列COL由小到大進(jìn)行排序。若COL為負(fù)數(shù)表示按照降序排列。

?（2）參考文案：

??? 對(duì)角矩陣
???知乎-簡(jiǎn)潔全面PCA方法講述

總結(jié)

以上是生活随笔為你收集整理的PAC—主成分分析方法的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： IBM欧洲裁员一万人、Salesforc
下一篇：主成分分析PAC