Apriori关联规则算法
生活随笔
收集整理的這篇文章主要介紹了
Apriori关联规则算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
關聯規則算法中的幾個重要概念:置信度、支持度、提升度、
例子:
支持度: 支持度是一個百分比,指某個商品組合出現的次數與總次數之間的比例,支持度越高表示該組合出現的幾率越大。
在上面圖中我們可以發現“牛奶”出現了 4 次,那么這 5 筆訂單中“牛奶”的支持度就是 4/5=0.8。 同樣“牛奶 + 面包”出現了 3 次,那么這 5 筆訂單中“牛奶 + 面包”的支持度就是 3/5=0.6。置信度: 表示你購買了A商品后,你還會有多大的概率購買B商品。
置信度(牛奶→啤酒)=2/4=0.5,代表如果你購買了牛奶,有多大的概率會購買啤酒? 置信度(啤酒→牛奶)=2/3=0.67,代表如果你購買了啤酒,有多大的概率會購買牛奶? 我們能看到,在 4 次購買了牛奶的情況下,有 2 次購買了啤酒,所以置信度 (牛奶→啤酒)=0.5,而在 3 次購買啤酒的情況下,有 2 次購買了牛奶,所以置信度(啤酒→牛奶)=0.67。提升度: 在做商品推薦的時候,提升度是重點考慮對象,提升度代表商品A的出現,對商品B的出現概率提升了多少,即“商品 A 的出現?
總結
以上是生活随笔為你收集整理的Apriori关联规则算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: K折交叉验证和pipeline
- 下一篇: PageRanke算法