增量数据挖掘论文推荐
生活随笔
收集整理的這篇文章主要介紹了
增量数据挖掘论文推荐
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
論文背景介紹
Fp-tree的改進(jìn)算法
Cantree算法簡介
對Fp-tree的構(gòu)造做了精簡,省去了Fp-tree開始對1-itemset的support_count的統(tǒng)計,所以它僅僅需要掃描一次數(shù)據(jù)庫。在構(gòu)造樹的過程中對于每個transaction中的itemsets按照一個固定順序排序(比如升序排序),然后按照Fp-tree的構(gòu)造方法遍歷數(shù)據(jù)庫。形成的Cantree要比Fp-tree大一些,因為它增加了一些非頻繁項。正因為如此,當(dāng)有新的db‘加入時,它可以直接對transaction進(jìn)行掃描加入Cantree當(dāng)中。
CanTree在查找過程類似于Fp-tree,不同點在于因為Fp-tree中的節(jié)點已經(jīng)按照support_count排序,它的查找過程是自下而上的,而CanTree需要對上下路徑分別進(jìn)行查找,并排除其中小于min_support_count的項。
詳細(xì)的算法介紹和測評結(jié)果見論文:CanTree a tree structure for efficient incremental mining of frequent patterns
總結(jié)
以上是生活随笔為你收集整理的增量数据挖掘论文推荐的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 线框模型_进行计划之前:线框和模型
- 下一篇: 工作经验教训_在设计工作五年后获得的经验