當前位置：首頁 >

模糊关联规则挖掘

發布時間：2025/3/15 22 豆豆

生活随笔收集整理的這篇文章主要介紹了模糊关联规则挖掘小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?模糊關聯規則挖掘

? 關聯規則挖掘是數據挖掘最基本和最常用的算法之一，Apriori算法基本上是每個學習數據挖掘的同學掌握的第一個算法。但是，一般的關聯規則挖掘算法無法處理涉及連續值的記錄。? 雖然某些算法把連續值通過劃分區間的方法離散化，但是這種硬邊界劃分的方法效果并不是很好，一些在邊緣附近的數據只能屬于一個劃分，而這與事實不符。比如，年齡的一個劃分可以是青年，但如果我們把青年的區間定義為[20，30]，則19歲的人就被排除在青年的范圍之外了，顯然這不是很合適。針對這種問題，我們可以基于模糊集把區間劃分成多個模糊集，然后求得某個元素屬于某個模糊集的概率（根據模糊隸屬函數），這樣的話每個元素都可以屬于多個不同的模糊集，而不是只屬于一個集合。劃分模糊集的常用算法是FCM，見參考文獻。

? 當我們給定了所有連續值屬性的模糊集劃分之后，下一步就是進行關聯規則的挖掘了，我們定義問題如下：

? T={t₁,t₂,...,t_n}是數據集

? I={i₁,i₂,...,i_m}是屬性集，我們假定所有的屬性都是數值型。

? F_ik={f_ik¹,f_ik²,...,f_ik^l}代表第ik個屬性的模糊集。

? 我們要挖掘的模糊關聯規則的形式為：

? ?If X is A then Y is B.

? 其中，X和Y是屬性，A和B是X，Y對應的模糊集中的某個劃分，比如：

? X為年齡，其對應的模糊集為{嬰兒，幼兒，少年，青年，壯年，老年}，A為青年，Y為薪水，其對應的模糊集為{低薪，中薪，高薪}，B為高薪。

? 模糊關聯規則挖掘的過程為：

? 1. 計算significance factor

? 對于每個屬性X與X屬性對應的模糊集的劃分的屬性-劃分對<X,A>,比如<年齡，青年>,計算其significance系數：

? 其中

? m_aj是用FCM算法已經算好的模糊隸屬函數的值，只有當其大于閥值w時，我們才會取其值，否則只取0.

? ?2. 計算certainty factor

? 對于第一步求得的所有的significance系數大于給定值的<Z,C>對，我們計算所有屬性-劃分對：<X,A>,<Y,B>的certainty系數：

? 求得的certainty系數大于給定值的<X,A>,<Y,B>就是我們要挖掘的關聯規則：

? If X is A then Y is B.?

? ? 參考文獻：

? ? [1] Chan Man Kuok, Ada Fu, Man Hon Wong. Mining Fuzzy Association Rules in Databases.

? ? [2] FCM聚類算法簡介

轉載于:https://www.cnblogs.com/kemaswill/archive/2012/11/05/2755826.html

總結

以上是生活随笔為你收集整理的模糊关联规则挖掘的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

模糊关联规则挖掘

總結