数据挖掘学习笔记:标称属性(名词性)的邻近性度量
鄰近性度量:相似性和相異性度量
標(biāo)稱(chēng)屬性:可以擁有2個(gè)或者更多個(gè)屬性值
例:標(biāo)稱(chēng)屬性color:red,yellow,black,blue,green.(有5個(gè)屬性值可選)
問(wèn):對(duì)象由標(biāo)稱(chēng)屬性刻畫(huà),那么怎么判定對(duì)象之間的相異性呢?
答:有兩個(gè)方法
Method 1.簡(jiǎn)單匹配
d( i , j ) = (p-m) / p
m : p個(gè)變量中匹配的個(gè)數(shù)(表示對(duì)象i與對(duì)象j之間有相同屬性值的個(gè)數(shù))
p : 全部變量的個(gè)數(shù)(表示標(biāo)稱(chēng)屬性可選的屬性值的個(gè)數(shù),在上例中,p=5)
可以對(duì)屬性的值賦予權(quán)重
?
Method 2.使用一系列的二進(jìn)制屬性
為M個(gè)名義狀態(tài)的每一個(gè)產(chǎn)生一個(gè)新的二進(jìn)制/二元屬性
例:對(duì)象i:red
則對(duì)象i的編碼為:10000. ? ? ? 即:red(√)yellow(x)black(x)blue(x)green(x)
顯而易見(jiàn),0代表不出現(xiàn),1代表出現(xiàn)
那么,接下來(lái)就應(yīng)該使用 二元屬性的鄰近性度量 來(lái)刻畫(huà)對(duì)象之間的相異性
總結(jié)
以上是生活随笔為你收集整理的数据挖掘学习笔记:标称属性(名词性)的邻近性度量的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python表示整除的符号_c语言中整除
- 下一篇: 标称属性样本相似性度量