MATLAB实战系列(二十七)-数据预处理-PCA主成分分析
生活随笔
收集整理的這篇文章主要介紹了
MATLAB实战系列(二十七)-数据预处理-PCA主成分分析
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
我們在進(jìn)行數(shù)據(jù)分析時(shí),往往會(huì)發(fā)現(xiàn)數(shù)據(jù)具有很多種屬性,比如某類型餅干的口味、加工方式、保質(zhì)期、價(jià)格、購買人群等等。每一種屬性就代表該數(shù)據(jù)在某一維度上的數(shù)值。多維度的數(shù)據(jù)無疑會(huì)增加數(shù)據(jù)的準(zhǔn)確性與可靠性,但也給我們的計(jì)算帶來麻煩。
主成分分析(Principal Component Analysis,PCA)是一種常用的數(shù)據(jù)分析方法,通常用于提取數(shù)據(jù)的主要特征分量,從而完成對高維數(shù)據(jù)進(jìn)行降維的過程。
PCA對數(shù)據(jù)的降維不是簡單的維度挑選,而是將m維的數(shù)據(jù)映射到n維上(n<m),并且保證得到的n維數(shù)據(jù)仍能準(zhǔn)確表示原數(shù)據(jù)特征。
例如現(xiàn)在我們的數(shù)據(jù)如下圖所示,x1,x2代表原數(shù)據(jù)的兩個(gè)維度。這時(shí)候我們看圖像,也不好說x1,x2哪個(gè)特性更能代表數(shù)據(jù)特征。
總結(jié)
以上是生活随笔為你收集整理的MATLAB实战系列(二十七)-数据预处理-PCA主成分分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: NLPCC:预训练在小米的推理优化落地
- 下一篇: Matlab在概率统计中的应用问题及解决