PCA方法及其应用
來源
https://www.icourse163.org/course/BIT-1001872001
主成分分析(PCA)
- 主成分分析(Principal Component Analysis,PCA)是最常用的 一種降維方法,通常用于高維數據集的探索與可視化,還可以用作數 據壓縮和預處理等。
- PCA可以把具有相關性的高維變量合成為線性無關的低維變量,稱為 主成分。主成分能夠盡可能保留原始數據的信息。
在介紹PCA的原理之前涉及到的相關術語:
- 方差
- 協方差
- 協方差矩陣
- 特征向量和特征值
方差:是各個樣本和樣本均值的差的平方和的均值,用來度量一組 數據的分散程度
協方差:用于度量兩個變量之間的線性相關性程度,若兩個變量的 協方差為0,則可認為二者線性無關。協方差矩陣則是由變量的協方差值 構成的矩陣(對稱陣)。
特征向量:矩陣的特征向量是描述數據集結構的非零向量,并滿足 如下公式:
A是方陣, ?是特征向量,?
總結
- 上一篇: DBSCAN密度聚类
- 下一篇: 基于聚类的“图像分割”