hadoop常见算法(持续更新)
生活随笔
收集整理的這篇文章主要介紹了
hadoop常见算法(持续更新)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
?
1. 對以下數據進行排序,根據收入減去支出得到最后結余從大到小排序
賬號 收入 支出 日期 zhangsan@163.com 6000 0 2014-02-20 lisi@163.com 2000 0 2014-02-20 lisi@163.com 0 100 2014-02-20 zhangsan@163.com 3000 0 2014-02-20 wangwu@126.com 9000 0 2014-02-20 wangwu@126.com 0 200 2014-02-20最后結果形式為:
lisi@163.com 2000 100 1900 wangwu@126.com 9000 200 8800 zhangsan@163.com 9000 0 9000?
2. 倒排索引、ETL、過濾 (文本查找),解析和校驗
?
?
3. Partition的使用
?
?
4. 雙下標排序
?
5. 利用MapReduce求解海量數據文件中的最大值
?
?
6. 計數器
?
7. k-means聚類算法
?
?
8. 計數與求和
?
?
?
?
References:
[1] hadoop常用算法簡單實例
轉載于:https://www.cnblogs.com/tuhooo/p/7905129.html
總結
以上是生活随笔為你收集整理的hadoop常见算法(持续更新)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 泛型类
- 下一篇: R语言数组array函数