日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

FreeBSD下安装配置Hadoop集群(性能调优)

發(fā)布時(shí)間:2025/3/20 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 FreeBSD下安装配置Hadoop集群(性能调优) 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
hadoop的性能調(diào)優(yōu)是個(gè)比較艱難的事情,由于這個(gè)系統(tǒng)的整個(gè)環(huán)境比較復(fù)雜,對(duì)于接觸時(shí)間不長(zhǎng)的人來說,配置都很難,更別說找出性能優(yōu)化的點(diǎn)了。
性能優(yōu)化涉及的方面很廣,操作系統(tǒng),網(wǎng)絡(luò)配置,配置文件,調(diào)度器等等,抓出幾點(diǎn)來說,但不敢說這幾點(diǎn)就是別人所遇到的性能瓶頸,拋磚引玉而已。應(yīng)用場(chǎng)景不同,優(yōu)化配置肯定是各不相同的。
對(duì)于操作系統(tǒng)和網(wǎng)絡(luò)環(huán)境的調(diào)優(yōu),這個(gè)需要講的東西就太多了,無(wú)法在一篇文章里贅述。集中于幾個(gè)關(guān)鍵詞:sysctl,ulimit,hosts文件,內(nèi)網(wǎng)配置。
盡量把hadoop集群配置在內(nèi)網(wǎng)地址上,這就不用多說了吧。
下面主要探討hadoop的配置文件和調(diào)度器的選擇和開發(fā)。
以我公司的hadoop集群舉例來說,主要是用了數(shù)據(jù)壓縮和索引和對(duì)調(diào)度器策略的優(yōu)化。
使用壓縮是一個(gè)不錯(cuò)的選擇,比如我們自己的集群用的是LZO的壓縮方式,壓縮比大概是原始數(shù)據(jù)的1/3,也就是說,1G的原始日志大概能壓縮成300Mb左右,一方面壓縮比不錯(cuò),另一方面,讀取速度也很不錯(cuò),配合的是Native的lzo庫(kù)。一個(gè)叫hadoop-gpl的東西。前一陣子泰國(guó)水災(zāi),硬盤難買,以壓縮的方式也可以多撐一陣子。
如果給lzo建立索引,效果就更好了
當(dāng)然你需要先安裝hadoopgpl。core-site.xml <property>
????????????????<name>io.compression.codecs</name>
????????????????<value>org.apache.hadoop.io.compress.DefaultCodec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec,org.apache.hadoop.io.compress.GzipCodec,org.apache
.hadoop.io.compress.BZip2Codec</value>
? ? ? ??</property>
????????<property>
????????????????<name>io.compression.codec.lzo.class</name>
????????????????<value>com.hadoop.compression.lzo.LzoCodec</value>
? ? ? ??</property>
mapred-site.xml <property>
????????????????<name>mapred.compress.map.output</name>
????????????????<value>true</value>
? ? ? ??</property>
????????<property>
????????????????<name>mapred.map.output.compression.codec</name>
????????????????<value>com.hadoop.compression.lzo.LzoCodec</value>
? ? ? ??</property>
????????<property>
????????????????<name>mapred.child.java.opts</name>
????????????????<value>-Djava.library.path=/opt/hadoopgpl/native/Linux-amd64-64</value>
? ? ? ??</property>
當(dāng)然每臺(tái)服務(wù)器都需要定義這個(gè)才可以。
還有一個(gè)很重要的優(yōu)化是槽位的設(shè)置和調(diào)度器的選擇,這個(gè)直接關(guān)系到hadoop的計(jì)算能力。相同硬件情況下,配置好的集群的在計(jì)算相同任務(wù)的情況下,要比配置糟糕的集群快幾倍乃至幾十倍。
對(duì)于map/reduce槽位的配置還有job對(duì)java虛擬機(jī)的配置,我目前總結(jié)的規(guī)律大概是這樣,namenode的槽位總數(shù)相加和等于CPU數(shù)量,同時(shí)map槽位數(shù)大概是reduce槽位的3倍,也就是這樣,如果你有一個(gè)8核的服務(wù)器,map數(shù)量就應(yīng)該是6,reduce數(shù)量是2。對(duì)于datanode,我們需要他的計(jì)算能力強(qiáng)一些,就把map和reduce槽位總和設(shè)置成cpu數(shù)量的2倍,同時(shí)map數(shù)是reduce數(shù)量的3倍,同樣是8核的datanode,map數(shù)就是12,reduce數(shù)就是4。對(duì)于內(nèi)存的使用,還是拿配置文件舉例說明吧。
mapred-site on namenode:<property>
????????<name>mapred.tasktracker.map.tasks.maximum</name>
????????<value>6</value>
????????<final>true</final>
????</property>
????<property>
????????<name>mapred.tasktracker.reduce.tasks.maximum</name>
????????<value>2</value>
????????<final>true</final>
????</property>
????<property>
????????<name>mapred.child.java.opts</name>
????????<value>-Xmx1536M</value>
????</property>
mapred-site on datanode:<property>
????????<name>mapred.tasktracker.map.tasks.maximum</name>
????????<value>12</value>
????????<final>true</final>
????</property>
????<property>
????????<name>mapred.tasktracker.reduce.tasks.maximum</name>
????????<value>4</value>
????????<final>true</final>
????</property>
????<property>
????????<name>mapred.map.child.java.opts</name>
????????<value>-Xmx1224M</value>
????</property>
????<property>
????????<name>mapred.reduce.child.java.opts</name>
????????<value>-Xmx2048M</value>
????</property>
對(duì)于map槽位的內(nèi)存占用,我的理解是這樣,內(nèi)存總數(shù)/CPU核數(shù)/4,上下可以浮動(dòng)幾百兆。對(duì)于reduce槽位是內(nèi)存總數(shù)/cpu核數(shù)/2。
然后簡(jiǎn)單說下調(diào)度器的問題,hadoop默認(rèn)的調(diào)度器是FIFO,就是先入先出,通常來說,這就比較夠用了。但是如果集群規(guī)模較小,計(jì)算任務(wù)又比較多,還需要細(xì)分不同任務(wù)的槽位分配,就還是配置其他的調(diào)度器比較好。
常用的有兩種第三方調(diào)度器,yahoo開發(fā)的Capacity Scheduler和Facebook貢獻(xiàn)的Fair Scheduler。翻譯過來叫計(jì)算能力調(diào)度器和公平調(diào)度器,可能大家聽公平調(diào)度器聽的比較多,不過目前我們公司主要是用計(jì)算能力調(diào)度器。
因?yàn)榕渲玫腦ML太長(zhǎng),我就不貼了,需要了解計(jì)算能力調(diào)度器的配置方法,可以訪問我的同事老趙的技術(shù)博客。
http://blog.csdn.net/azhao_dn/article/details/7070327

在我們的應(yīng)用場(chǎng)景里,計(jì)算能力被分為了3類,每個(gè)分類的map/reudce槽位數(shù)是不同的,根據(jù)統(tǒng)計(jì)平時(shí)的計(jì)算量來固定分配的槽位數(shù)。default,rush,和hive,其中普通的streaming的計(jì)算方式放入default的分類中執(zhí)行,日志清洗和入庫(kù)單獨(dú)使用rush分類,hive,顧名思義,就是給hive數(shù)據(jù)庫(kù)單獨(dú)使用的。這個(gè)分配的map/reduce是最多的。平時(shí)定時(shí)任務(wù)的70%左右都是用hive跑的,臨時(shí)數(shù)據(jù)查詢95%依賴hive。
這樣做的好處是計(jì)算任務(wù)的計(jì)算能力被隔離,互不干擾。可根據(jù)業(yè)務(wù)需求進(jìn)行分類。避免任務(wù)搶占造成的資源大量消耗。

轉(zhuǎn)載于:https://blog.51cto.com/slaytanic/823321

總結(jié)

以上是生活随笔為你收集整理的FreeBSD下安装配置Hadoop集群(性能调优)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: av电影在线播放 | 成人黄色电影在线 | 欧美123 | 欧美性做爰免费观看 | 黑鬼大战白妞高潮喷白浆 | 亚洲一区二区自拍 | 视频一区 国产 | 午夜黄色| 99久久综合国产精品二区 | 免费午夜视频在线观看 | 91操操| 噜噜啪啪| 大陆农村乡下av | 日韩永久免费视频 | 最新精品在线 | 人妻在线日韩免费视频 | 奇米影视四色777 | 九九在线精品视频 | 久久一二区| 沟厕沟厕近拍高清视频 | 日韩成人综合网 | 特级毛片在线观看 | 色天天色综合 | 亚洲无码精品在线播放 | 激情婷婷六月天 | 天天操天天干天天 | 免费看黄色三级三级 | 国产精品久久国产精麻豆96堂 | 国产男女猛烈无遮挡免费观看网站 | 制服丝袜国产精品 | 国产一级片免费播放 | jizz欧美性11| 人人干在线视频 | 欧美日韩一区二区区别是什么 | 久草中文视频 | 俄罗斯av在线| 成人在线观看网站 | 欧美福利片在线观看 | 污版视频在线观看 | 好吊日av | 美女被c出水 | 婷婷综合av | 肉大捧一进一出免费视频 | 亚洲av成人无码一二三在线观看 | 色网站在线免费观看 | 99精品国产免费 | 国产欧美精品久久 | 久久久久国产一区二区三区 | 久久裸体视频 | 一区二区国产精品精华液 | 91成人福利视频 | 911av| 人妻激情偷乱频一区二区三区 | 亚洲视频www| 欧美日韩国产不卡 | 深夜老司机福利 | 久久精品亚洲天堂 | 欧美日韩大陆 | 亚洲精品一区二区二区 | 91蝌蚪在线观看 | 亚洲 小说 欧美 激情 另类 | 十八岁世界在线观看高清免费韩剧 | 国产偷国产偷av亚洲清高 | 国产无精乱码一区二区三区 | 九九热最新 | 97久久精品 | 强公把我次次高潮hd | 乌克兰少妇性做爰 | 国产精品久久久久久一区二区 | 欧美成在线观看 | 国产人妖在线播放 | 不卡精品视频 | 艳妇臀荡乳欲伦交换在线播放 | 一本色道久久综合狠狠躁 | 天堂一区二区三区 | 亚洲女同一区二区 | 免费午夜人成电影 | 国产精品亚洲一区二区三区在线观看 | 污漫在线观看 | 黄色网av | 国产网址在线观看 | 亚洲不卡一区二区三区 | 国产一在线| 国产做受高潮 | 国产福利一区二区三区在线观看 | 亚洲黄网av | 欧美丝袜一区二区三区 | 亚洲国产精品欧美久久 | 亚洲色图网址 | 国产精品中文无码 | 大尺度av | 久久精品国产亚洲a | 日韩av在线资源 | 91精品国产99久久久久久红楼 | 成人免费看片在线观看 | 91国自啪 | 污片在线看 | 久久受 | 无码精品人妻一区二区 |