机器学习笔记(十三):降维
生活随笔
收集整理的這篇文章主要介紹了
机器学习笔记(十三):降维
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
1)Motivation 1:Data Compression
2)Motivation 2: Data Visualization
3)Principal Component Analysis problem formulation
4)Principal Component Analysis algorithm
5)Advice for applying PCA
1)Motivation 1:Data Compression
無監督學習第二個算法:降維,降維有兩個目的:1是數據壓縮,2是可視化,數據壓縮就是減少特征。工業中我們常常會碰到上萬的特征,這是我們就需要壓縮數據,找出其中重要的特征。下面是3維壓縮為2維的例子:
2)Motivation 2: Data Visualization
能將數據可視化的話對我們處理問題很有幫助,下面是關于幾個國家GDP可視化的例子:
3)Principal Component Analysis problem formulation
主成分分析是常見的降維方法。
需要注意的是:主成分分析不是線性回歸。
主成分分析是最小化投射誤差,線性回歸是最小化預測誤差。下圖左面是線性回歸,右邊是主成分分析。
?
4)Principal Component Analysis algorithm
下面介紹PCA算法:
1)均值歸一化:
2)計算協方差矩陣:
3)計算協方差矩陣的特征向量;
5)Advice for applying PCA
使用從訓練集得來特征向量;
PCA不宜用來防止過擬合;
PCA不是必要的機器學習過程;
總結
以上是生活随笔為你收集整理的机器学习笔记(十三):降维的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: kencapi.exe是什么进程 ken
- 下一篇: 1.Introduction and