几种常用范数与距离的关系
1 范數
向量的范數可以簡單形象的理解為向量的長度,或者向量到零點的距離,或者相應的兩個點之間的距離。
向量的范數定義:向量的范數是一個函數||x||,滿足非負性||x|| >= 0,齊次性||cx|| = |c| ||x|| ,三角不等式||x+y|| <= ||x|| + ||y||。
常用的向量的范數:L1范數: ?||x|| 為x向量各個元素絕對值之和。
L2范數: ?||x||為x向量各個元素平方和的1/2次方,L2范數又稱Euclidean范數或者Frobenius范數
Lp范數: ?||x||為x向量各個元素絕對值p次方和的1/p次方
L∞范數: ?||x||為x向量各個元素絕對值最大那個元素的絕對值,如下:
橢球向量范數: ||x||A ?= sqrt[T(x)Ax], T(x)代表x的轉置。定義矩陣C 為M個模式向量的協方差矩陣, 設C’是其逆矩陣,則Mahalanobis距離定義為||x||C’ ?= sqrt[T(x)C’x], 這是一個關于C’的橢球向量范數。
2 距離
歐式距離(對應L2范數):最常見的兩點之間或多點之間的距離表示法,又稱之為歐幾里得度量,它定義于歐幾里得空間中。n維空間中兩個點x1(x11,x12,…,x1n)與 x2(x21,x22,…,x2n)間的歐氏距離:
也可以用表示成向量運算的形式:
曼哈頓距離:曼哈頓距離對應L1-范數,也就是在歐幾里得空間的固定直角坐標系上兩點所形成的線段對軸產生的投影的距離總和。例如在平面上,坐標(x1, y1)的點P1與坐標(x2, y2)的點P2的曼哈頓距離為:,要注意的是,曼哈頓距離依賴座標系統的轉度,而非系統在座標軸上的平移或映射。
切比雪夫距離,若二個向量或二個點x1和x2,其坐標分別為(x11, x12, x13, … , x1n)和(x21, x22, x23, … , x2n),則二者的切比雪夫距離為:d = max(|x1i - x2i|),i從1到n。對應L∞范數。
閔可夫斯基距離(Minkowski?Distance),閔氏距離不是一種距離,而是一組距離的定義。對應Lp范數,p為參數。
閔氏距離的定義:兩個n維變量(或者兩個n維空間點)x1(x11,x12,…,x1n)與?x2(x21,x22,…,x2n)間的閔可夫斯基距離定義為:?
其中p是一個變參數。
當p=1時,就是曼哈頓距離,
當p=2時,就是歐氏距離,
當p→∞時,就是切比雪夫距離, ? ? ??
根據變參數的不同,閔氏距離可以表示一類的距離。?
Mahalanobis距離:也稱作馬氏距離。在近鄰分類法中,常采用歐式距離和馬氏距離。
3 在機器學習中的應用
L1范數和L2范數,用于機器學習的L1正則化、L2正則化。對于線性回歸模型,使用L1正則化的模型建叫做Lasso回歸,使用L2正則化的模型叫做Ridge回歸(嶺回歸)。
其作用是:
L1正則化是指權值向量w中各個元素的絕對值之和,可以產生稀疏權值矩陣(稀疏矩陣指的是很多元素為0,只有少數元素是非零值的矩陣,即得到的線性回歸模型的大部分系數都是0.?),即產生一個稀疏模型,可以用于特征選擇;
L2正則化是指權值向量w中各個元素的平方和然后再求平方根,可以防止模型過擬合(overfitting);一定程度上,L1也可以防止過擬合。
至于為什么L1正則化能增加稀疏性,L2正則化能防止過擬合,原理可查看參考資料。
參考資料:
http://blog.csdn.net/v_july_v/article/details/8203674
http://blog.csdn.net/jinping_shi/article/details/52433975
總結
以上是生活随笔為你收集整理的几种常用范数与距离的关系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 你知道荷兰旗问题吗?
- 下一篇: Docker入门,看了不理解,假一赔命