数学建模-相关性分析(Matlab)
?注意:代碼文件僅供參考,一定不要直接用于自己的數(shù)模論文中
國賽對于論文的查重要求非常嚴格,代碼雷同也算作抄襲
如何修改代碼避免查重的方法:https://www.bilibili.com/video/av59423231? ?//清風數(shù)學建模
一、基礎(chǔ)知識
1.皮爾遜相關(guān)系數(shù)
連續(xù)數(shù)據(jù)、正態(tài)分布、線性關(guān)系三者同時滿足優(yōu)先用。
一般處理這種問題:如中學生體測成績考察相關(guān)性????
?統(tǒng)計描述:
%% 統(tǒng)計描述 MIN = min(Test); % 每一列的最小值 MAX = max(Test); % 每一列的最大值 MEAN = mean(Test); % 每一列的均值 MEDIAN = median(Test); %每一列的中位數(shù) SKEWNESS = skewness(Test); %每一列的偏度 KURTOSIS = kurtosis(Test); %每一列的峰度 STD = std(Test); % 每一列的標準差 RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD] %將這些統(tǒng)計量放到一個矩陣中表示?excel方法更好:
選中數(shù)據(jù)(包括中文如引體向上),點擊上方數(shù)據(jù),點擊右邊數(shù)據(jù)分析,描述統(tǒng)計(勾上標志位于第一行)
SPSS最好(附基礎(chǔ)操作步驟📕):
1.左上角點擊文件,導入原始excel
點擊上面分析,描述統(tǒng)計,描述(選中該選的,調(diào)調(diào)就得圖)
2.看圖分析:點擊上面圖形,舊對話框,散點圖/點圖,點擊矩陣散點圖,變量全選,生成。
各列之間相關(guān)系數(shù):
R = corrcoef(Test) % 返回test的相關(guān)系數(shù)矩陣 R = corrcoef(a,b) % 返回兩個隨機變量a和b之間的系數(shù)?注意:
?一定要是線性,否則結(jié)論不一定成立,例如拋物線。
2.假設(shè)性檢驗(正態(tài)分布圖)
a:犯第一類錯(原假設(shè)是對的,我們卻認為它是錯的)的概率
b=1-a 相信原假設(shè)的概率(一般取95%) n(樣本數(shù))-2為自由度
檢驗值t=r*根號下n-2/1-r^2 ,r是相關(guān)系數(shù)
結(jié)合t分布表和matlab:
%% 假設(shè)檢驗部分 x = -4:0.1:4; y = tpdf(x,28); %求t分布的概率密度值 28是自由度 figure(1) plot(x,y,'-') grid on % 在畫出的圖上加上網(wǎng)格線 hold on % 保留原來的圖,以便繼續(xù)在上面操作 % matlab可以求出臨界值,函數(shù)如下 tinv(0.975,28) % 2.0484 % 這個函數(shù)是累積密度函數(shù)cdf的反函數(shù) plot([-2.048,-2.048],[0,tpdf(-2.048,28)],'r-') plot([2.048,2.048],[0,tpdf(2.048,28)],'r-')?結(jié)合最后的t分布表,可以查到自由度為28時候,置信度為0.5(雙尾)對應(yīng)的t為2.0484
更好用:p值判斷法
%% 計算p值 x = -4:0.1:4; y = tpdf(x,28); figure(2) plot(x,y,'-') grid on hold on % 畫線段的方法 plot([-3.055,-3.055],[0,tpdf(-3.055,28)],'r-') plot([3.055,3.055],[0,tpdf(3.055,28)],'r-') disp('該檢驗值對應(yīng)的p值為:') disp((1-tcdf(3.055,28))*2) %雙側(cè)檢驗的p值要乘以23.055是檢驗值t,最后一步是求p,這里不再細說。因為spss法最優(yōu)。
p<0.01說明在99%的置信水平上拒絕原假設(shè)。
p>0.01…………相信原假設(shè)
0.05,0.10同理
?SPSS法:
把excel表里都弄過去后,原始數(shù)據(jù)分析,相關(guān),雙變量相關(guān)性,勾選皮爾遜、雙尾、第三個也勾
這時會發(fā)現(xiàn),數(shù)據(jù)后會帶*星號,有一顆兩顆的。我們規(guī)定:
P < 0.01 ?% 標記3顆星的位置
(P < 0.05) .* (P > 0.01) ?% 標記2顆星的位置
(P < 0.1) .* (P > 0.05) % % 標記1顆星的位置
3.檢驗數(shù)據(jù)是否正態(tài)分布
1.正態(tài)分布JB檢驗(大樣本n>50)
主要是根據(jù)偏度(正態(tài)分布為0)和峰度(正態(tài)分布為3),再結(jié)合jbtest函數(shù),同時注意要循環(huán)遍歷每一列。最后得p值,也是比較0.05決定是否拒絕原假設(shè)
% 正態(tài)分布的偏度和峰度 x = normrnd(2,3,100,1); % 生成100*1的隨機向量,每個元素是均值為2,標準差為3的正態(tài)分布 skewness(x) %偏度 kurtosis(x) %峰度 qqplot(x)% 檢驗第一列數(shù)據(jù)是否為正態(tài)分布 [h,p] = jbtest(Test(:,1),0.05) [h,p] = jbtest(Test(:,1),0.01)% 用循環(huán)檢驗所有列的數(shù)據(jù) n_c = size(Test,2); % number of column 數(shù)據(jù)的列數(shù) H = zeros(1,6); % 初始化節(jié)省時間和消耗 P = zeros(1,6); for i = 1:n_c[h,p] = jbtest(Test(:,i),0.05);H(i)=h;P(i)=p; end disp(H) disp(P)h=1拒絕原假設(shè),h為0不能拒絕原假設(shè)。p即為p值。?
2.夏皮洛-威爾克檢驗(小樣本 3《n《50)
用SPSS:
分析,描述統(tǒng)計,探索,全選后點 圖,勾選含檢驗的正態(tài)圖,最后生成正態(tài)檢驗圖。
看h,p的方法同上。
3.看圖是否擬合(Q-Q圖)
qqplot(Test(:,1))?4.斯皮爾曼spearman相關(guān)系數(shù)
原理:X和Y兩組數(shù)據(jù),也有X和Y的等級(一個數(shù)所在的一列數(shù)按照從小到大排后,這個數(shù)所在的位置,若如并列第四,均取4.5)
%% 斯皮爾曼相關(guān)系數(shù) X = [3 8 4 7 2]' % 一定要是列向量哦,一撇'表示求轉(zhuǎn)置 Y = [5 10 9 10 6]' % 第一種計算方法 1-6*(1+0.25+0.25+1)/5/24% 第二種計算方法 coeff = corr(X , Y , 'type' , 'Spearman') % 等價于: RX = [2 5 3 4 1] RY = [1 4.5 3 4.5 2] R = corrcoef(RX,RY)% 計算矩陣各列的斯皮爾曼相關(guān)系數(shù) R = corr(Test, 'type' , 'Spearman')(Test是591*6中考體測數(shù)據(jù))
最后假設(shè)檢驗,也是看p
% 大樣本下的假設(shè)檢驗 % 計算檢驗值 disp(sqrt(590)*0.0301) % 計算p值 disp((1-normcdf(0.7311))*2) % normcdf用來計算標準正態(tài)分布的累積概率密度函數(shù)% 直接給出相關(guān)系數(shù)和p值 [R,P]=corr(Test, 'type' , 'Spearman')附錄:T分布表
| 1 | 6.3138 | 12.7065 | 31.8193 | 63.6551 | 127.3447 | 318.4930 | 636.0450 |
| 2 | 2.9200 | 4.3026 | 6.9646 | 9.9247 | 14.0887 | 22.3276 | 31.5989 |
| 3 | 2.3534 | 3.1824 | 4.5407 | 5.8408 | 7.4534 | 10.2145 | 12.9242 |
| 4 | 2.1319 | 2.7764 | 3.7470 | 4.6041 | 5.5976 | 7.1732 | 8.6103 |
| 5 | 2.0150 | 2.5706 | 3.3650 | 4.0322 | 4.7734 | 5.8934 | 6.8688 |
| 6 | 1.9432 | 2.4469 | 3.1426 | 3.7074 | 4.3168 | 5.2076 | 5.9589 |
| 7 | 1.8946 | 2.3646 | 2.9980 | 3.4995 | 4.0294 | 4.7852 | 5.4079 |
| 8 | 1.8595 | 2.3060 | 2.8965 | 3.3554 | 3.8325 | 4.5008 | 5.0414 |
| 9 | 1.8331 | 2.2621 | 2.8214 | 3.2498 | 3.6896 | 4.2969 | 4.7809 |
| 10 | 1.8124 | 2.2282 | 2.7638 | 3.1693 | 3.5814 | 4.1437 | 4.5869 |
| 11 | 1.7959 | 2.2010 | 2.7181 | 3.1058 | 3.4966 | 4.0247 | 4.4369 |
| 12 | 1.7823 | 2.1788 | 2.6810 | 3.0545 | 3.4284 | 3.9296 | 4.3178 |
| 13 | 1.7709 | 2.1604 | 2.6503 | 3.0123 | 3.3725 | 3.8520 | 4.2208 |
| 14 | 1.7613 | 2.1448 | 2.6245 | 2.9768 | 3.3257 | 3.7874 | 4.1404 |
| 15 | 1.7530 | 2.1314 | 2.6025 | 2.9467 | 3.2860 | 3.7328 | 4.0728 |
| 16 | 1.7459 | 2.1199 | 2.5835 | 2.9208 | 3.2520 | 3.6861 | 4.0150 |
| 17 | 1.7396 | 2.1098 | 2.5669 | 2.8983 | 3.2224 | 3.6458 | 3.9651 |
| 18 | 1.7341 | 2.1009 | 2.5524 | 2.8784 | 3.1966 | 3.6105 | 3.9216 |
| 19 | 1.7291 | 2.0930 | 2.5395 | 2.8609 | 3.1737 | 3.5794 | 3.8834 |
| 20 | 1.7247 | 2.0860 | 2.5280 | 2.8454 | 3.1534 | 3.5518 | 3.8495 |
| 21 | 1.7207 | 2.0796 | 2.5176 | 2.8314 | 3.1352 | 3.5272 | 3.8193 |
| 22 | 1.7172 | 2.0739 | 2.5083 | 2.8188 | 3.1188 | 3.5050 | 3.7921 |
| 23 | 1.7139 | 2.0686 | 2.4998 | 2.8073 | 3.1040 | 3.4850 | 3.7676 |
| 24 | 1.7109 | 2.0639 | 2.4922 | 2.7970 | 3.0905 | 3.4668 | 3.7454 |
| 25 | 1.7081 | 2.0596 | 2.4851 | 2.7874 | 3.0782 | 3.4502 | 3.7251 |
| 26 | 1.7056 | 2.0555 | 2.4786 | 2.7787 | 3.0669 | 3.4350 | 3.7067 |
| 27 | 1.7033 | 2.0518 | 2.4727 | 2.7707 | 3.0565 | 3.4211 | 3.6896 |
| 28 | 1.7011 | 2.0484 | 2.4671 | 2.7633 | 3.0469 | 3.4082 | 3.6739 |
| 29 | 1.6991 | 2.0452 | 2.4620 | 2.7564 | 3.0380 | 3.3962 | 3.6594 |
| 30 | 1.6973 | 2.0423 | 2.4572 | 2.7500 | 3.0298 | 3.3852 | 3.6459 |
| 31 | 1.6955 | 2.0395 | 2.4528 | 2.7440 | 3.0221 | 3.3749 | 3.6334 |
| 32 | 1.6939 | 2.0369 | 2.4487 | 2.7385 | 3.0150 | 3.3653 | 3.6218 |
| 33 | 1.6924 | 2.0345 | 2.4448 | 2.7333 | 3.0082 | 3.3563 | 3.6109 |
| 34 | 1.6909 | 2.0322 | 2.4411 | 2.7284 | 3.0019 | 3.3479 | 3.6008 |
| 35 | 1.6896 | 2.0301 | 2.4377 | 2.7238 | 2.9961 | 3.3400 | 3.5912 |
| 36 | 1.6883 | 2.0281 | 2.4345 | 2.7195 | 2.9905 | 3.3326 | 3.5822 |
| 37 | 1.6871 | 2.0262 | 2.4315 | 2.7154 | 2.9853 | 3.3256 | 3.5737 |
| 38 | 1.6859 | 2.0244 | 2.4286 | 2.7115 | 2.9803 | 3.3190 | 3.5657 |
| 39 | 1.6849 | 2.0227 | 2.4258 | 2.7079 | 2.9756 | 3.3128 | 3.5581 |
| 40 | 1.6839 | 2.0211 | 2.4233 | 2.7045 | 2.9712 | 3.3069 | 3.5510 |
?40往后查看http://www.obhrm.net/index.php/T%E5%88%86%E5%B8%83%E8%A1%A8_t_distribution_table
總結(jié)
以上是生活随笔為你收集整理的数学建模-相关性分析(Matlab)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海思3559:百兆网口的配置
- 下一篇: 二十四节气和计算机专业,命理学与二十四节