MapReduce初级案例
生活随笔
收集整理的這篇文章主要介紹了
MapReduce初级案例
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1、數(shù)據(jù)去重
"數(shù)據(jù)去重"主要是為了掌握和利用并行化思想來對數(shù)據(jù)進(jìn)行有意義的篩選。統(tǒng)計大數(shù)據(jù)集上的數(shù)據(jù)種類個數(shù)、從網(wǎng)站日志中計算訪問地等這些看似龐雜的任務(wù)都會涉及數(shù)據(jù)去重。下面就進(jìn)入這個實(shí)例的MapReduce程序設(shè)計。
1.1 實(shí)例描述
對數(shù)據(jù)文件中的數(shù)據(jù)進(jìn)行去重。數(shù)據(jù)文件中的每行都是一個數(shù)據(jù)。
樣例輸入如下所示:
1)file1:
2012-3-1 a
2012-3-2 b
2012-3-3 c
2012-3-4 d
2012-3-5 a
2012-3-6 b
2012-3-7 c
總結(jié)
以上是生活随笔為你收集整理的MapReduce初级案例的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Eclipse开发环境设置
- 下一篇: 以非root 用戶安裝並啟動高級單服務器