一些粗糙集的学习感悟
上述應(yīng)該注意的是,假如X={x1,x2,x5},那么雖然x1和x2是不可分辨關(guān)系,但其實(shí)X也是可以精確描述的,因?yàn)閧x1,x2}放在一起可以用同一個(gè)屬性去描述,x5可以單獨(dú)描述。所以并不是說(shuō)集合里有不可分辨關(guān)系就不能精確描述。但是下面的例子:X={x1,x2,x3,x5}就不行,因?yàn)楹蛒3有不可分辨關(guān)系的x4并不在X中,所以是無(wú)法通過(guò)知識(shí)庫(kù)里的交和并來(lái)精確描述這個(gè)X的。
這里應(yīng)該注意,上述描述,是判斷用條件屬性能否描述給定的集合,而下述的概念是,能否用化簡(jiǎn)后的知識(shí)系統(tǒng)去精確描述決策屬性的值,但本質(zhì)的知識(shí)是一樣的。
(能否用化簡(jiǎn)后的知識(shí)系統(tǒng)去精確描述決策屬性的值的本質(zhì)其實(shí)也是判斷用條件屬性能否描述給定的集合:比如穩(wěn)定決策屬性的集合就是X1={x1,x2,x5},不穩(wěn)定的決策屬性集合就是X2={x3,x4,x6,x7,x8},然后用各種知識(shí)系統(tǒng)去判斷能否精確描述這兩個(gè)集合。)
整個(gè)粗集理論的核心就是上面說(shuō)的有關(guān)知識(shí)、集合的劃分、近似集合等等概念。下面我們討論一下關(guān)于粗糙集在數(shù)據(jù)庫(kù)中數(shù)據(jù)挖掘的應(yīng)用問(wèn)題。考慮一個(gè)數(shù)據(jù)庫(kù)中的二維表如下:
元素 顏色 形狀 大小 穩(wěn)定性
x1 紅 三角 大 穩(wěn)定
x2 紅 三角 大 穩(wěn)定
x3 黑 圓 小 不穩(wěn)定
x4 黑 圓 小 不穩(wěn)定
x5 藍(lán) 方塊 大 穩(wěn)定
x6 紅 圓 中 不穩(wěn)定
x7 藍(lán) 圓 小 不穩(wěn)定
x8 藍(lán) 方塊 中 不穩(wěn)定
可以看出,這個(gè)表就是上面的那個(gè)例子的二維表格體現(xiàn),而最后一列是我們的決策屬性,也就是說(shuō)評(píng)價(jià)什么樣的積木穩(wěn)定。這個(gè)表中的每一行表示了類(lèi)似這樣的信息:紅色的大三角積木穩(wěn)定,黑色的小圓形不穩(wěn)定等等。我們可以把所有的記錄看成是論域A={x1,x2,x3,x4,x5,x6,x7,x8},任意一個(gè)列表示一個(gè)屬性構(gòu)成了對(duì)論域的元素上的一個(gè)劃分,在劃分的每一個(gè)類(lèi)中都具有相同的屬性。而屬性可以分成兩大類(lèi),一類(lèi)叫做條件屬性:顏色、形狀、大小都是,另一類(lèi)叫做決策屬性:最后一列的是否穩(wěn)定?下面我們考慮,對(duì)于決策屬性來(lái)說(shuō)是否所有的條件屬性都是有用的呢?考慮所有決策屬性是“穩(wěn)定”的集合{x1,x2,x5},它在知識(shí)系統(tǒng)A/R中的上下近似都是{x1,x2,x5}本身,“不穩(wěn)定”的集合{x3,x4,x6,x7,x8},在知識(shí)系統(tǒng)A/R中的上下近似也都是{x3,x4,x6,x7,x8}它本身。說(shuō)明該知識(shí)庫(kù)能夠?qū)@個(gè)概念進(jìn)行很好的描述。下面考慮是否所有的基本知識(shí):顏色、形狀、大小都是必要的?如果我們把這個(gè)集合在知識(shí)系統(tǒng)中去掉顏色這個(gè)基本知識(shí),那么知識(shí)系統(tǒng)變成A/(R-R1)={{x1,x2},{x3,x4,x7},,,}以及這些子集的并集。如果用這個(gè)新的知識(shí)系統(tǒng)表達(dá)“穩(wěn)定”概念,那么得到的上下近似仍舊都是:{x1,x2,x5},“不穩(wěn)定”概念的上下近似也還是{x3,x4,x6,x7,x8},由此看出去掉顏色屬性我們表達(dá)穩(wěn)定性的知識(shí)不會(huì)有變化,所以說(shuō)顏色屬性是多余的可以刪除。如果再考慮是否能去掉大小屬性呢?這個(gè)時(shí)候知識(shí)系統(tǒng)就變?yōu)?#xff1a;
A/(R-R1-R3)=A/R2={{x1,x2},{x5,x8},{x3,x4,x6,x7}}。同樣考慮“穩(wěn)定”在知識(shí)系統(tǒng)A/R2中的上下近似分別為:{x1,x2,x5,x8}和{x1,x2},已經(jīng)和原來(lái)知識(shí)系統(tǒng)中的上下近似不一樣了,同樣考慮“不穩(wěn)定”的近似表示也變化了,所以刪除屬性“大小”是對(duì)知識(shí)表示有影響的故而不能去掉。同樣的討論對(duì)于“形狀”屬性,“形狀”屬性是不能去掉的。A/(R-R2)={{x1,x2},x6,{x3,x4},x5,x7,x8},通過(guò)求并可以得知“穩(wěn)定”的下近似和上近似都是{x1,x2,x5},“不穩(wěn)定”的上下近似都是{x3,x4,x6,x7,x8}。最后我們得到化簡(jiǎn)后的知識(shí)庫(kù)R2,R3,從而能得到下面的決策規(guī)則:大三角->穩(wěn)定,大方塊->穩(wěn)定,小圓->不穩(wěn)定,中圓->不穩(wěn)定,中方塊->不穩(wěn)定,利用粗集的理論還可以對(duì)這些規(guī)則進(jìn)一步化簡(jiǎn)得到:大->穩(wěn)定,圓->不穩(wěn)定,中方塊->不穩(wěn)定。這就是上面這個(gè)數(shù)據(jù)表所包含的真正有用的知識(shí),而這些知識(shí)都是從數(shù)據(jù)庫(kù)有粗糙集方法自動(dòng)學(xué)習(xí)得到的。因此,粗糙集是數(shù)據(jù)庫(kù)中論域的有效方法。
(但是上述部分有點(diǎn)問(wèn)題,因?yàn)槠鋵?shí)A/(R-R1-R2)=A/R3={{x1, x2, x5}, {x3,x4,x7},{x6, x8}},{x1,x2,x5}和{x3,x4,x6,x7,x8}的上下近似也都是相同的。所以我懷疑是例子或者敘述給錯(cuò)了。)
總結(jié)
以上是生活随笔為你收集整理的一些粗糙集的学习感悟的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: tcpdump与Wireshark抓包分
- 下一篇: 干货!基于表征的噪声转移矩阵估计方法