日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )

發(fā)布時間:2025/6/17 编程问答 24 豆豆

文章目錄

  • 一、 關聯(lián)規(guī)則挖掘簡介
  • 二、 數(shù)據(jù)集 與 事物 ( Transaction ) 概念
  • 三、項 ( Item ) 概念
  • 四、項集 ( Item Set ) 概念
  • 五、頻繁項集
  • 六、數(shù)據(jù)集、事物、項、項集合、項集 示例





一、 關聯(lián)規(guī)則挖掘簡介



Apriori 算法 是 關聯(lián)規(guī)則 挖掘算法 ,

關聯(lián)規(guī)則 反映了 對象之間 相互依賴關系 ,

可以通過 一個對象 的行為或屬性 預測 其它對象的行為或屬性 ;


關聯(lián)規(guī)則 不是 因果關系 , 有可能有因果關系 , 有可能沒有 ;

如 : 購買商品時 , 啤酒 與 尿布 就有關聯(lián)關系 , 這兩個之間肯定沒有因果關系 , 有一種未知的關聯(lián)關系 ;


關聯(lián)規(guī)則挖掘步驟 :

① 步驟一 : 找出 支持度 ≥\geq 最小支持度閾值頻繁項集 ;

② 步驟二 : 根據(jù) 頻繁模式 生成 滿足 可信度閾值關聯(lián)規(guī)則 ;





二、 數(shù)據(jù)集 與 事物 ( Transaction ) 概念



數(shù)據(jù)集 與 事物 ( Transaction ) 概念 :

數(shù)據(jù)挖掘 數(shù)據(jù)集 事物 構成 ;

數(shù)據(jù)集 記做 DDD ;

使用事物表示 數(shù)據(jù)集 , 表示為 D={t1,t2,?,tn}D = \{ t_1 , t_2 , \cdots , t_n \}D={t1?,t2?,?,tn?} ,

其中 tk,(k=1,2,?,n)t_k , \ ( k = 1, 2, \cdots, n )tk?,?(k=1,2,?,n) 稱為事物 ;

每個事物可以使用 唯一的標識符 表示 事物編號 ( TID ) ;





三、項 ( Item ) 概念



項 ( Item ) 概念 :

每個 事物 ( Transaction ) 由多個 項 ( Item ) 組成 ;

項 記做 iii ;

表示為 tk={i1,i2,?,in}t_k = \{ i_1 , i_2 , \cdots , i_n \}tk?={i1?,i2?,?,in?} ;

數(shù)據(jù)集 DDD 是所有 項 iii 的集合 是 III 集合 ;





四、項集 ( Item Set ) 概念



項集 ( Item Set ) 概念 :

III 中的 任意子集 XXX , 稱為 數(shù)據(jù)集 DDD項集 ( Item Set ) ;

如果 項集 ( Item Set ) 中 項 ( Item ) 個數(shù)為 kkk ,

則稱該 項集 ( Item Set ) 為 kkk 項集 ( k-itemset ) ;





五、頻繁項集



頻繁項集 : 頻繁項集指的是出現(xiàn)次數(shù)較多的項集 ;





六、數(shù)據(jù)集、事物、項、項集合、項集 示例



事物編號事物 ( 商品 )
001001001奶粉 , 萵苣
002002002萵苣 , 尿布 , 啤酒 , 甜菜
003003003奶粉 , 尿布 , 啤酒 , 橙汁
004004004奶粉 , 萵苣 , 尿布 , 啤酒
005005005奶粉 , 萵苣 , 尿布 , 橙汁

整個 數(shù)據(jù)集 DDD , 由 555 個事物 構成 ;


數(shù)據(jù)集 : D={t1,t2,t3,t4,t5}D = \{ t_1 , t_2 , t_3 , t_4, t_5 \}D={t1?,t2?,t3?,t4?,t5?}


事物 111 : t1={奶粉,萵苣}t_1 = \{ 奶粉 , 萵苣 \}t1?={,}

事物 222 : t2={萵苣,尿布,啤酒,甜菜}t_2 = \{ 萵苣 , 尿布 , 啤酒 , 甜菜 \}t2?={,尿,,}

事物 333 : t3={奶粉,尿布,啤酒,橙汁}t_3 = \{ 奶粉 , 尿布 , 啤酒 , 橙汁 \}t3?={,尿,,}

事物 444 : t4={奶粉,萵苣,尿布,啤酒}t_4 = \{ 奶粉 , 萵苣 , 尿布 , 啤酒 \}t4?={,,尿,}

事物 555 : t5={奶粉,萵苣,尿布,橙汁}t_5 = \{ 奶粉 , 萵苣 , 尿布 , 橙汁 \}t5?={,,尿,}


上述 事物 集合中的元素 iii 都稱為項 , 奶粉,萵苣,尿布,啤酒,甜菜,橙汁奶粉 , 萵苣 , 尿布 , 啤酒 , 甜菜 , 橙汁,,尿,,, 都是 項 ;


I={奶粉,萵苣,尿布,啤酒,甜菜,橙汁}I = \{ 奶粉 , 萵苣 , 尿布 , 啤酒 , 甜菜 , 橙汁 \}I={,,尿,,,}


項集 : 任意不相同的項組成的集合就稱為項集 , 上述 666 個元素的集合有 262^626 個項集 ; 參考集合冪集個數(shù)

{奶粉}\{ 奶粉 \}{}111 項集 ;

{尿布,啤酒}\{ 尿布 , 啤酒 \}{尿,}222 項集 ;

{萵苣,尿布,啤酒}\{ 萵苣 , 尿布 , 啤酒 \}{,尿,}333 項集 ;

{奶粉,萵苣,尿布,啤酒}\{ 奶粉 , 萵苣 , 尿布 , 啤酒 \}{,,尿,}444 項集 ;

{奶粉,萵苣,尿布,啤酒,甜菜}\{ 奶粉 , 萵苣 , 尿布 , 啤酒 , 甜菜 \}{,,尿,,}555 項集 ;

{奶粉,萵苣,尿布,啤酒,甜菜,橙汁}\{ 奶粉 , 萵苣 , 尿布 , 啤酒 , 甜菜 , 橙汁 \}{,,尿,,,}666 項集 ;

總結

以上是生活随笔為你收集整理的【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。