海量数据
用堆解決TopK問(wèn)題:
找最大K個(gè)用小頂堆/最小K個(gè)用大頂堆:
長(zhǎng)度為K的數(shù)組,存入K個(gè)數(shù)據(jù),建立小頂堆
依次從K+1往后和堆頂比較,小于則pass,大于則替換并重新建立小頂堆
最終堆中K個(gè)元素即是要找的TopK
分布在不同電腦中:
同一種數(shù)據(jù)只出現(xiàn)在一臺(tái)電腦中:比正常多用一次TopK方法
同一種元素可以出現(xiàn)在不同電腦中:重新遍歷所有并hash取模,再用TopK
轉(zhuǎn)載于:https://www.cnblogs.com/zawjdbb/p/7340311.html
總結(jié)
- 上一篇: 在ubuntu16下安装virtuale
- 下一篇: [LeetCode] 9. Palind