日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

Hadoop集群部署模型纵览1

發(fā)布時(shí)間:2025/3/17 编程问答 16 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Hadoop集群部署模型纵览1 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

vSphere Big Data Extensions(簡(jiǎn)稱BDE)支持多種部署方式來(lái)構(gòu)建Hadoop集群。按:

  • 存儲(chǔ)/計(jì)算綁定模型:將存儲(chǔ)節(jié)點(diǎn)(Data Node)和計(jì)算節(jié)點(diǎn)(Task Tracker)部署在相同的虛擬機(jī)中。這是最直接簡(jiǎn)單的部署模型,可以用于概念驗(yàn)證和承載小規(guī)模集群的數(shù)據(jù)處理任務(wù)。

  • 單一計(jì)算模型:只部署計(jì)算節(jié)點(diǎn)(Job TrackerTask Tracker)的集群類型。

  • 存儲(chǔ)/計(jì)算分離模型:將存儲(chǔ)節(jié)點(diǎn)(Data Node)和計(jì)算節(jié)點(diǎn)(Task Tracker)部署在不同的虛擬機(jī)中,并且根據(jù)特定的業(yè)務(wù)需求,通過(guò)相應(yīng)的分布算法決定集群在vSphereESX物理主機(jī)上的拓?fù)浣Y(jié)構(gòu)。

  • 自定制集群:用戶可以根據(jù)具體的業(yè)務(wù)需求,自定制集群的部署結(jié)構(gòu)、資源模型和配置參數(shù)。

本文我們將著重介紹前2個(gè)部署模型,即存儲(chǔ)/計(jì)算綁定模型和單一計(jì)算模型。

存儲(chǔ)和計(jì)算節(jié)點(diǎn)綁定模型Data-Compute Combined Deployment

通常情況下,我們?yōu)榱吮WCHadoop集群數(shù)據(jù)本地化(Data Locality)的需要,會(huì)將存儲(chǔ)(DataNode)和計(jì)算(TaskTracker)服務(wù)部署在相同節(jié)點(diǎn)上。Big Data Extensions也提供這樣的部署模式。

你可以使用BDE的命令行工具,通過(guò)運(yùn)行cluster create --name cluster_name命令創(chuàng)建一個(gè)基本的默認(rèn)Hadoop集群。

這類集群將包含一個(gè)主節(jié)點(diǎn)(master),運(yùn)行Apache Hadoop 1.2.1BDE 1.0內(nèi)置的默認(rèn)Hadoop發(fā)行版)的NameNodeJobTracker;三個(gè)工作節(jié)點(diǎn)(worker),運(yùn)行DataNodeTaskTracker;一個(gè)客戶端節(jié)點(diǎn)(Clientnode),運(yùn)行Hadoop客戶端,PigHive等。

這里將DataNodeTaskTracker搭建在同一個(gè)虛擬機(jī)節(jié)點(diǎn)內(nèi)部,這就是存儲(chǔ)和計(jì)算節(jié)點(diǎn)綁定模型。


單一計(jì)算節(jié)點(diǎn)模型Compute-OnlyDeployment

如果你的生產(chǎn)或開(kāi)發(fā)環(huán)境里已經(jīng)有了HDFS,并且有數(shù)以TB的分析型數(shù)據(jù)存在于其中,商業(yè)分析團(tuán)隊(duì)根據(jù)新的業(yè)務(wù)需求,開(kāi)發(fā)新功能去挖掘新的模式,這時(shí)您可以搭建一個(gè)單一計(jì)算節(jié)點(diǎn)集群(Compute-OnlyCluster)。

單一計(jì)算節(jié)點(diǎn)集群指的是只部署MapReduce服務(wù),包括JobtrackerTasktracker,并且鏈接到某個(gè)已經(jīng)存在的HDFS上。這樣做的好處有很多,首先可以避免搭建完整集群后的大規(guī)模數(shù)據(jù)拷貝或遷移,減少開(kāi)發(fā)環(huán)境的等待時(shí)間,可以立即部署立即使用,非常適合臨時(shí)性的開(kāi)發(fā)測(cè)試環(huán)境;其次,也可以在不同的計(jì)算集群之間做到性能隔離,安全性隔離和故障隔離;另外,在兼容性滿足的情況下,您也可以使用第三方的商業(yè)版HDFSIsilon等等。

對(duì)于單一計(jì)算節(jié)點(diǎn)集群,您也可以使用動(dòng)態(tài)伸縮功能(Auto-Elasiticity)來(lái)動(dòng)態(tài)地調(diào)配您的資源。

下面列舉了這種集群部署的實(shí)例定義文件,您可以使用它創(chuàng)建Compute-OnlyClusterexternalHDFS字段定義了要使用的已存在的HDFS服務(wù)。請(qǐng)將hadoop_jobtracker角色賦給master節(jié)點(diǎn)組,將hadoop_tasktracker角色賦給worker節(jié)點(diǎn)組。對(duì)于externalHDFS所指定的HDFS集群,默認(rèn)情況下請(qǐng)?jiān)O(shè)置port_num8020。對(duì)于Hadoop2.0集群,例如CDH4或是PivotalHD等,默認(rèn)情況下請(qǐng)?jiān)O(shè)置port_num9000。在集群定義文件中,ExternalHDFS字段和hadoop_namenodehadoop_datanode角色不能同時(shí)存在,否則可能會(huì)導(dǎo)致集群創(chuàng)建失敗或創(chuàng)建的集群無(wú)法正常運(yùn)行。

{

"externalHDFS": "hdfs://<hostname-of-namenode>:<port_num>",

"nodeGroups": [

{

"name": "master",

"roles": [

"hadoop_jobtracker"

],

"instanceNum": 1,

"cpuNum": 2,

"memCapacityMB": 7500,

},

{

"name": "worker",

"roles": [

"hadoop_tasktracker",

],

"instanceNum": 4,

"cpuNum": 2,

"memCapacityMB": 7500,

"storage": {

"type": "LOCAL",

"sizeGB": 20

},

},

{

"name": "client",

"roles": [

"hadoop_client",

"hive",

"pig"

],

"instanceNum": 1,

"cpuNum": 1,

"storage": {

"type": "LOCAL",

"sizeGB": 50

},

}

]

}


如有任何問(wèn)題,您可以發(fā)郵件至bigdata_apac@vmware.com


關(guān)于vSphere Big Data Extensions:

VMware vSphere Big Data Extensions(簡(jiǎn)稱BDE)基于vSphere平臺(tái)支持大數(shù)據(jù)和Apache Hadoop作業(yè)。BDE以開(kāi)源Serengeti項(xiàng)目為基礎(chǔ),為企業(yè)級(jí)用戶提供一系列整合的管理工具,通過(guò)在vSphere上虛擬化Apache Hadoop,幫助用戶在基礎(chǔ)設(shè)施上實(shí)現(xiàn)靈活、彈性、安全和快捷的大數(shù)據(jù)部署、運(yùn)行和管理工作。了解更多關(guān)于VMware vSphere Big Data Extensions的信息,請(qǐng)參見(jiàn)http://www.vmware.com/hadoop。


作者介紹

張錦波

VMware大數(shù)據(jù)解決方案工程師

目前負(fù)責(zé)VMware大數(shù)據(jù)解決方案的架構(gòu)和實(shí)現(xiàn),是大數(shù)據(jù)方面的技術(shù)專家。曾擔(dān)任vSphere Big Data Extensions(BDE)、Serengeti等大數(shù)據(jù)項(xiàng)目的產(chǎn)品經(jīng)理,負(fù)責(zé)集群管理,高可靠性和彈性伸縮等重要功能的規(guī)劃。在此之前就職于EMC,從事數(shù)據(jù)庫(kù)管理等產(chǎn)品的研發(fā)工作。

總結(jié)

以上是生活随笔為你收集整理的Hadoop集群部署模型纵览1的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。