【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )
文章目錄
- 一、 非頻繁項(xiàng)集超集性質(zhì)
- 二、 頻繁項(xiàng)集子集性質(zhì)
- 三、 項(xiàng)集與超集支持度性質(zhì)
參考博客 :
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 關(guān)聯(lián)規(guī)則簡介 | 數(shù)據(jù)集 與 事物 Transaction 概念 | 項(xiàng) Item 概念 | 項(xiàng)集 Item Set | 頻繁項(xiàng)集 | 示例解析 )
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 關(guān)聯(lián)規(guī)則 | 數(shù)據(jù)項(xiàng)支持度 | 關(guān)聯(lián)規(guī)則支持度 )
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 置信度 | 置信度示例 )
- 【數(shù)據(jù)挖掘】關(guān)聯(lián)規(guī)則挖掘 Apriori 算法 ( 頻繁項(xiàng)集 | 非頻繁項(xiàng)集 | 強(qiáng)關(guān)聯(lián)規(guī)則 | 弱關(guān)聯(lián)規(guī)則 | 發(fā)現(xiàn)關(guān)聯(lián)規(guī)則 )
一、 非頻繁項(xiàng)集超集性質(zhì)
關(guān)聯(lián)規(guī)則 性質(zhì) 1 : 非頻繁項(xiàng)集 的 超集 一定是 非頻繁的 ;
超集 就是 包含 該集合的集合 ;
項(xiàng)集 X\rm XX 是 非頻繁項(xiàng)集 ,
項(xiàng)集 Y\rm YY 是 項(xiàng)集 X\rm XX 的超集 ,
( 使用集合表示 : X?Y,X=??\rm X \subseteq Y , X \not= \varnothingX?Y,X?=? , 項(xiàng)集 Y\rm YY 包含 項(xiàng)集 X\rm XX , 并且 項(xiàng)集 X\rm XX 不為空集 )
則 項(xiàng)集 Y\rm YY 一定是 非頻繁的 ;
舉例 :
數(shù)據(jù)集 D\rm DD 為 :
| 001001001 | 奶粉 , 萵苣 |
| 002002002 | 萵苣 , 尿布 , 啤酒 , 甜菜 |
| 003003003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
| 004004004 | 奶粉 , 萵苣 , 尿布 , 啤酒 |
| 005005005 | 奶粉 , 萵苣 , 尿布 , 橙汁 |
111 項(xiàng)集 {甜菜}\{ 甜菜 \}{甜菜}
222 項(xiàng)集 {甜菜,啤酒}\{ 甜菜 , 啤酒 \}{甜菜,啤酒}
上述 {甜菜,啤酒}\{ 甜菜 , 啤酒 \}{甜菜,啤酒} 就是 {甜菜}\{ 甜菜 \}{甜菜} 的 超集 ,
111 項(xiàng)集 {甜菜}\{ 甜菜 \}{甜菜} 其支持度是 0.2\rm 0.20.2 , 小于最小支持度 minsup=0.6\rm minsup = 0.6minsup=0.6, 是 非頻繁項(xiàng)集
那么 {甜菜,啤酒}\{ 甜菜 , 啤酒 \}{甜菜,啤酒} 也是 非頻繁項(xiàng)集 ;
在具體算法中會使用該性質(zhì) , 用于進(jìn)行 “剪枝” 操作 ;
計(jì)算支持度時(shí) , 按照 111 項(xiàng)集 支持度 , 222 項(xiàng)集 支持度 , ?\cdots? 順序進(jìn)行計(jì)算 ,
如果發(fā)現(xiàn) 111 項(xiàng)集 中有 非頻繁項(xiàng)集 , 則包含該 111 項(xiàng)集的 n\rm nn 項(xiàng)集 肯定是 非頻繁項(xiàng)集 ;
然后使用 頻繁 111 項(xiàng)集 組合成 222 項(xiàng)集 , 然后再計(jì)算這些 222 項(xiàng)集是否是頻繁項(xiàng)集 ;
“剪枝” 操作 減少了不必要的計(jì)算量 ;
二、 頻繁項(xiàng)集子集性質(zhì)
頻繁項(xiàng)集 的 所有非空子集 , 一定是 頻繁項(xiàng)集 ;
項(xiàng)集 Y\rm YY 是 頻繁項(xiàng)集 ,
項(xiàng)集 Y\rm YY 是 項(xiàng)集 X\rm XX 的超集 ,
( 使用集合表示 : X?Y,X=??\rm X \subseteq Y , X \not= \varnothingX?Y,X?=? , 項(xiàng)集 Y\rm YY 包含 項(xiàng)集 X\rm XX , 并且 項(xiàng)集 X\rm XX 不為空集 )
則 項(xiàng)集 X\rm XX 一定是 頻繁的 ;
舉例 :
數(shù)據(jù)集 D\rm DD 為 :
| 001001001 | 奶粉 , 萵苣 |
| 002002002 | 萵苣 , 尿布 , 啤酒 , 甜菜 |
| 003003003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
| 004004004 | 奶粉 , 萵苣 , 尿布 , 啤酒 |
| 005005005 | 奶粉 , 萵苣 , 尿布 , 橙汁 |
111 項(xiàng)集 {尿布}\{ 尿布 \}{尿布} , {啤酒}\{ 啤酒 \}{啤酒}
222 項(xiàng)集 {尿布,啤酒}\{ 尿布 , 啤酒 \}{尿布,啤酒}
222 項(xiàng)集 {尿布,啤酒}\{ 尿布 , 啤酒 \}{尿布,啤酒} 其支持度是 0.6\rm 0.60.6 , 等于最小支持度 minsup=0.6\rm minsup = 0.6minsup=0.6, 是 頻繁項(xiàng)集
那么 222 項(xiàng)集 {尿布,啤酒}\{ 尿布 , 啤酒 \}{尿布,啤酒} 的子集是 111 項(xiàng)集 {尿布}\{ 尿布 \}{尿布} , {啤酒}\{ 啤酒 \}{啤酒} ,
根據(jù)上述性質(zhì) , 111 項(xiàng)集 {尿布}\{ 尿布 \}{尿布} , {啤酒}\{ 啤酒 \}{啤酒} 都是 頻繁項(xiàng)集 ;
三、 項(xiàng)集與超集支持度性質(zhì)
任意一個(gè) 項(xiàng)集 的 支持度 , 都 大于等于 其 超集 支持度 ;
超集 就是 包含 該集合的集合 ;
總結(jié)
以上是生活随笔為你收集整理的【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【数据挖掘】关联规则挖掘 Apriori
- 下一篇: 【数据挖掘】关联规则挖掘 Apriori