模式相似测度
前言
為了將模式劃分為不同的類別,需要定義一種相似測度來度量同一類樣本之間的相似性和不同樣本之間的差異性。現(xiàn)有的模型相似度大概可以分為三類:距離測度、相似測度和匹配測度。
距離相似測度
這種測度是基于兩個矢量矢端的距離距離作為測度基礎,因此距離測度值是兩矢量各相應分量之差的函數(shù)。
1. 歐氏距離
對于兩個樣本x=(x1,x2,???,xn)Tx=\left( x_1,x_2,···,x_n \right) ^Tx=(x1?,x2?,???,xn?)T,y=(y1,y2,???,yn)Ty=\left( y_1,y_2,···,y_n \right) ^Ty=(y1?,y2?,???,yn?)T 其歐氏距離定義為:d(x,y)=∣∣x?y∣∣=[∑i=1n(xi?yi)2]12d\left( x,y \right) =||x-y||=\left[ \sum_{i=1}^n{\left( x_i-y_i \right) ^2} \right] ^{\frac{1}{2}} d(x,y)=∣∣x?y∣∣=[i=1∑n?(xi??yi?)2]21?
歐式距離是最常用的相似性測度。由歐氏距離確定的樣本具有平移和旋轉不變性。
2. 馬氏距離
設有nnn維矢量xix_ixi?和xjx_jxj?是矢量集(x1,x2,???,xn)(x_1,x_2,···,x_n)(x1?,x2?,???,xn?)中的兩個矢量,它們的馬氏距離定義為
d2(xi,xj)=(xi=xj)TV?1(xi?xj)d^2\left( x_i,x_j \right) =\left( x_i=x_j \right) ^TV^{-1}\left( x_i-x_j \right) d2(xi?,xj?)=(xi?=xj?)TV?1(xi??xj?)
式中V=1m?1∑i=1m(xi?xˉ)(xi?xˉ)TV=\frac{1}{m-1}\sum_{i=1}^m{\left( x_i-\bar{x} \right) \left( x_i-\bar{x} \right) ^T}V=m?11?i=1∑m?(xi??xˉ)(xi??xˉ)T
xˉ=1m∑i=1mxi\bar{x}=\frac{1}{m}\sum_{i=1}^m{x_i}xˉ=m1?i=1∑m?xi?
馬氏距離對一切非奇異線性變換都是不變的,也就是說馬氏距離具有平移不變性;另外由于VVV的含義是這個適量記得樣本協(xié)方差陣,所以馬氏距離對特性的相關性也作了處理。
3.明氏距離
明氏距離的公式如下:d(x,y)=[∑i=1n(xi?yi)m]1md\left( x,y \right) =\left[ \sum_{i=1}^n{\left( x_i-y_i \right)}^m \right] ^{\frac{1}{m}} d(x,y)=[i=1∑n?(xi??yi?)m]m1?
由上式看出,當m=1,為絕對距離;當m=2時,為歐氏距離。
相似測度
兩個矢量的方向是否相近作為度量的基礎,矢量長度并不重要,但其中有的度量依然考慮兩矢量端點距離,只是再將其轉化為具有相似測度的數(shù)值屬性。
角度相似性函數(shù)
用向量夾角的余弦來度量。在模式中具有扇形分布時,經(jīng)常采用這種測度:s(x,y)=cos?(x,y)=xTy∣∣x∣∣?∣∣y∣∣s\left( \boldsymbol{x,y} \right) =\cos \left( \boldsymbol{x,y} \right) =\frac{\boldsymbol{x}^T\boldsymbol{y}}{||x||·||y||} s(x,y)=cos(x,y)=∣∣x∣∣?∣∣y∣∣xTy?其中s(x,y)s\left( \boldsymbol{x,y} \right)s(x,y)是向量xxx和向量yyy之間夾角的余弦。
這種相似測度函數(shù)對于坐標系的旋轉和尺度縮放是不變的,但對于一般的線性變換和坐標系的平移不具有不變性。
若cos(x,y)=1cos(x,y)=1cos(x,y)=1即xxx和yyy夾角為0°則相似;若cos(x,y)=0cos(x,y)=0cos(x,y)=0即xxx和yyy夾角為90°則不相似。
相關系數(shù)
相關系數(shù)測度實際上是數(shù)據(jù)中心化后的矢量夾角余弦,定義為:
r(x,y)=(x?xˉ)(y?yˉ)[(x?xˉ)T(x?xˉ)(y?yˉ)T(y?yˉ)]12r\left( x,y \right) =\frac{\left( x-\bar{x} \right) \left( y-\bar{y} \right)}{\left[ \left( x-\bar{x} \right) ^T\left( x-\bar{x} \right) \left( y-\bar{y} \right) ^T\left( y-\bar{y} \right) \right] ^{\frac{1}{2}}} r(x,y)=[(x?xˉ)T(x?xˉ)(y?yˉ?)T(y?yˉ?)]21?(x?xˉ)(y?yˉ?)?
式子中,xxx和yyy代表兩個數(shù)據(jù)集的樣本,xˉ\bar{x}xˉ和yˉ\bar{y}yˉ?分別表示兩個數(shù)據(jù)集的平均矢量。這種相似測度函數(shù)對于坐標系的平移、旋轉和尺度縮放都是不變的。
匹配測度
匹配測度經(jīng)常用于醫(yī)學和生物學中的分類。在進行此類測度之前,需要先將圖像特征進行二值特征處理。所謂的二值特征處理就是若對象有此特征,則相應分量定義為1,若對象無此特征,則相應分量定義為0,即特征只有兩種狀態(tài)。對于二值nnn維特征矢量可定義如下相似度:
Tonimoto測度
TonimotoTonimotoTonimoto測度也稱為TonimotoTonimotoTonimoto距離,TonimotoTonimotoTonimoto測度可用于實向量測量,也可用于離散值測量,定義為:
s(x,y)=(xTy)(∣∣x∣∣2+∣∣y∣∣2?xTy)s\left( x,y \right) =\frac{\left( x^Ty \right)}{\left( ||x||^2+||y||^2-x^Ty \right)} s(x,y)=(∣∣x∣∣2+∣∣y∣∣2?xTy)(xTy)?
在這種相似測度函數(shù)中,當向量xxx和yyy越相似,s(x,y)s(x,y)s(x,y)值越大。
簡單匹配系數(shù)
m(x,y)=(∑ixiyi+∑i(1?xi)(1?yi))nm\left( x,y \right) =\frac{\left( \sum_i{x_iy_i}+\sum_i{\left( 1-x_i \right) \left( 1-y_i \right)} \right)}{n} m(x,y)=n(∑i?xi?yi?+∑i?(1?xi?)(1?yi?))?
式中,nnn為要考察的特征數(shù)目。
參考文獻
宋麗梅.模式識別 [M].機械工業(yè)出版社
總結
- 上一篇: Linux系统开机后/etc/rc.d/
- 下一篇: 酷比魔方iwork8连接电脑调试adb