日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Hadoop大数据——mapreduce中的Combiner/序列化/排序初步

發布時間:2025/1/21 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Hadoop大数据——mapreduce中的Combiner/序列化/排序初步 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
  • mapreduce中的Combiner

(1)combiner是MR程序中Mapper和Reducer之外的一種組件
(2)combiner組件的父類就是Reducer
(3)Combiner和reducer的區別在于運行的位置:
Combiner是在每一個maptask所在的節點運行
Reducer是接收全局所有Mapper的輸出結果;

  • mapreduce中的序列化

(1)Java的序列化是一個重量級序列化框架(Serializable),一個對象被序列化后,會附帶很多額外的信息(各種校驗信息,header,繼承體系。。。。),所以很臃腫,不便于在網絡中高效傳輸;
所以,hadoop自己開發了一套序列化機制(Writable),精簡,高效
簡單代碼驗證兩種序列化機制的差別:

public class TestSeri {public static void main(String[] args) throws Exception {//定義兩個ByteArrayOutputStream,用來接收不同序列化機制的序列化結果ByteArrayOutputStream ba = new ByteArrayOutputStream();ByteArrayOutputStream ba2 = new ByteArrayOutputStream();//定義兩個DataOutputStream,用于將普通對象進行jdk標準序列化DataOutputStream dout = new DataOutputStream(ba);DataOutputStream dout2 = new DataOutputStream(ba2);ObjectOutputStream obout = new ObjectOutputStream(dout2);//定義兩個bean,作為序列化的源對象ItemBeanSer itemBeanSer = new ItemBeanSer(1000L, 89.9f);ItemBean itemBean = new ItemBean(1000L, 89.9f);//用于比較String類型和Text類型的序列化差別Text atext = new Text("a");// atext.write(dout);itemBean.write(dout);byte[] byteArray = ba.toByteArray();//比較序列化結果System.out.println(byteArray.length);for (byte b : byteArray) {System.out.print(b);System.out.print(":");}System.out.println("-----------------------");String astr = "a";// dout2.writeUTF(astr);obout.writeObject(itemBeanSer);byte[] byteArray2 = ba2.toByteArray();System.out.println(byteArray2.length);for (byte b : byteArray2) {System.out.print(b);System.out.print(":");}} }
  • mapreduce的排序初步

MR程序在處理數據的過程中會對數據排序,排序的依據是mapper輸出的key

總結

以上是生活随笔為你收集整理的Hadoop大数据——mapreduce中的Combiner/序列化/排序初步的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。