数据挖掘(一)A-Priori
數(shù)據(jù)挖掘需要挖掘事物之間的關(guān)聯(lián)性,A-Priori是一個(gè)購(gòu)物籃模型,實(shí)質(zhì)上是一個(gè)教你快速統(tǒng)計(jì)頻繁項(xiàng)集的方法,其根據(jù)頻繁項(xiàng)集的單調(diào)性,來(lái)減少掃描的次數(shù)
比如我有很多購(gòu)物籃,每個(gè)籃子里有若干物品,如{青菜,黃瓜}{黃瓜,蘑菇,冬筍}{面條,醬油}{苗條,青菜}
我要推斷那些物品會(huì)同時(shí)出現(xiàn),這樣方便推薦,或者說(shuō)我能發(fā)現(xiàn)哪些物品之間有一定的關(guān)聯(lián)性;A-Priori就是干這個(gè)的
這個(gè)算法比較簡(jiǎn)單,就是一個(gè)掃描計(jì)數(shù)的過(guò)程,但是有兩點(diǎn),
1)是要將物品編碼,便于節(jié)省空間;
2)是K+1頻繁項(xiàng)集的尋找要建立在K頻繁項(xiàng)集合的基礎(chǔ)上,比如我要找一個(gè)3頻繁項(xiàng)集合,那么我可以推斷,這3個(gè)項(xiàng)的任意兩項(xiàng)組合必然在之前找到的2頻繁項(xiàng)集合中;
及時(shí)踢掉一些不可能成為頻繁項(xiàng)集的成分,減少掃描次數(shù);
凡是數(shù)據(jù)挖掘的算法重點(diǎn)不是在流程,而是在如何優(yōu)化過(guò)程,因?yàn)闇p少一步都能帶來(lái)巨大的效率,如何處理大數(shù)據(jù)!
總結(jié)
以上是生活随笔為你收集整理的数据挖掘(一)A-Priori的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QT移植多点触控
- 下一篇: html万花筒图片轮播代码,jQuery