hadoop学习--数据排序
生活随笔
收集整理的這篇文章主要介紹了
hadoop学习--数据排序
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
對輸入文件中的數據進行排序,輸入文件中每行為一個數字。輸出的每行為2個間隔的數字,第一個代表序號,第二個代表原始數字。
輸入:
2
7
5
1
7
6
8
7
輸出:
1 1
2 2
3 5
4 6
5 7
6 7
7 7
8 8
1、設計思路
在map過程中就有排序,因此利用這個默認的排序。并將其作為key值輸出。reduce得到<Key,value-list>,將key值作為value輸出,根據value-list的個數確定輸出次數。此外還需要輸出num,表示次序。
代碼如下:
[java]總結
以上是生活随笔為你收集整理的hadoop学习--数据排序的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hadoop学习--Hive安装与配置
- 下一篇: hadoop学习--单表关联