當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

深入理解Hadoop YARN中的Container概念

發(fā)布時(shí)間：2025/3/21 编程问答 38 豆豆

生活随笔收集整理的這篇文章主要介紹了深入理解Hadoop YARN中的Container概念小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

在學(xué)習(xí)Hadoop ?YARN—Hadoop 2.0新引入的通用資源管理系統(tǒng)過程中，總會(huì)遇到Container這一概念，由于中文資料的缺乏，很多人對(duì)Container這一概念仍非常的模糊。它與Linux Container是什么關(guān)系，它是否能像Linux Container那樣為任務(wù)提供一個(gè)隔離環(huán)境?它代表計(jì)算資源，還是僅僅是一個(gè)任務(wù)處理進(jìn)程？本文將嘗試介紹Container這一概念。

在學(xué)習(xí)Container之前，大家應(yīng)先了解YARN的基本架構(gòu)、工作流程。比如，大家應(yīng)該了解一個(gè)應(yīng)用程序的運(yùn)行過程如下：

步驟1：用戶將應(yīng)用程序提交到ResourceManager上；

步驟2：ResourceManager為應(yīng)用程序ApplicationMaster申請(qǐng)資源，并與某個(gè)NodeManager通信，以啟動(dòng)ApplicationMaster；

步驟3：ApplicationMaster與ResourceManager通信，為內(nèi)部要執(zhí)行的任務(wù)申請(qǐng)資源，一旦得到資源后，將于NodeManager通信，以啟動(dòng)對(duì)應(yīng)的任務(wù)。

步驟4：所有任務(wù)運(yùn)行完成后，ApplicationMaster向ResourceManager注銷，整個(gè)應(yīng)用程序運(yùn)行結(jié)束。

上述步驟中，步驟2~3涉及到資源申請(qǐng)與使用，而這正是Container出現(xiàn)的地方。

如果你你還不了解YARN的基本架構(gòu)和工作原理，可閱讀我的以下幾篇文章：

YARN基本架構(gòu)，YARN中的基本術(shù)語(yǔ)，YARN整套分析文章。

在YARN中，ResourceManager中包含一個(gè)插拔式的組件：資源調(diào)度器，它負(fù)責(zé)資源的管理和調(diào)度，是YARN中最核心的組件之一。

當(dāng)向資源調(diào)度器申請(qǐng)資源，需向它發(fā)送一個(gè)ResourceRequest列表，其中，每個(gè)ResourceRequest描述了一個(gè)資源單元的詳細(xì)需求，而資源調(diào)度器則為之返回分配到的資源描述Container。每個(gè)ResourceRequest可看做一個(gè)可序列化Java對(duì)象，包含的字段信息（直接給出了Protocol Buffers定義）如下：

message ResourceRequestProto {

optional PriorityProto priority = 1; // 資源優(yōu)先級(jí)

optional string resource_name = 2; // 資源名稱（期望資源所在的host、rack名稱等）

optional ResourceProto capability = 3; // 資源量（僅支持CPU和內(nèi)存兩種資源）

optional int32 num_containers = 4; // 滿足以上條件的資源個(gè)數(shù)

optional bool relax_locality = 5 [default = true]; ?//是否支持本地性松弛（2.1.0-beta之后的版本新增加的，具體參考我的這篇文章：Hadoop新特性、改進(jìn)、優(yōu)化和Bug分析系列3：YARN-392）

}

從上面定義可以看出，可以為應(yīng)用程序申請(qǐng)任意大小的資源量（CPU和內(nèi)存），且默認(rèn)情況下資源是本地性松弛的，即申請(qǐng)優(yōu)先級(jí)為10，資源名稱為“node11”，資源量為<2GB, 1cpu>的5份資源時(shí)，如果節(jié)點(diǎn)node11上沒有滿足要求的資源，則優(yōu)先找node11同一機(jī)架上其他節(jié)點(diǎn)上滿足要求的資源，如果仍找不到，則找其他機(jī)架上的資源。而如果你一定要node11上的節(jié)點(diǎn)，則將relax_locality置為false。

發(fā)出資源請(qǐng)求后，資源調(diào)度器并不會(huì)立馬為它返回滿足要求的資源，而需要應(yīng)用程序的ApplicationMaster不斷與ResourceManager通信，探測(cè)分配到的資源，并拉去過來(lái)使用。一旦分配到資源后，ApplicatioMaster可從資源調(diào)度器那獲取以Container表示的資源，Container可看做一個(gè)可序列化Java對(duì)象，包含的字段信息（直接給出了Protocol Buffers定義）如下：

message ContainerProto {

optional ContainerIdProto id = 1; //container id

optional NodeIdProto nodeId = 2; //container（資源）所在節(jié)點(diǎn)

optional string node_http_address = 3;

optional ResourceProto resource = 4; //container資源量

optional PriorityProto priority = 5; //container優(yōu)先級(jí)

optional hadoop.common.TokenProto container_token = 6; //container token，用于安全認(rèn)證

}

一般而言，每個(gè)Container可用于運(yùn)行一個(gè)任務(wù)。ApplicationMaster收到一個(gè)或多個(gè)Container后，再次將該Container進(jìn)一步分配給內(nèi)部的某個(gè)任務(wù)，一旦確定該任務(wù)后，ApplicationMaster需將該任務(wù)運(yùn)行環(huán)境（包含運(yùn)行命令、環(huán)境變量、依賴的外部文件等）連同Container中的資源信息封裝到ContainerLaunchContext對(duì)象中，進(jìn)而與對(duì)應(yīng)的NodeManager通信，以啟動(dòng)該任務(wù)。ContainerLaunchContext包含的字段信息（直接給出了Protocol Buffers定義）如下：

message ContainerLaunchContextProto {

repeated StringLocalResourceMapProto localResources = 1; //Container啟動(dòng)以來(lái)的外部資源

optional bytes tokens = 2;

repeated StringBytesMapProto service_data = 3;

repeated StringStringMapProto environment = 4; //Container啟動(dòng)所需的環(huán)境變量

repeated string command = 5; //Container內(nèi)部運(yùn)行的任務(wù)啟動(dòng)命令，如果是MapReduce的話，Map/Reduce Task啟動(dòng)命令就在該字段中

repeated ApplicationACLMapProto application_ACLs = 6;

}

每個(gè)ContainerLaunchContext和對(duì)應(yīng)的Container信息（被封裝到了ContainerToken中）將再次被封裝到StartContainerRequest中，也就是說，ApplicationMaster最終發(fā)送給NodeManager的是StartContainerRequest，每個(gè)StartContainerRequest對(duì)應(yīng)一個(gè)Container和任務(wù)。

總結(jié)上述可知，Container的一些基本概念和工作流程如下：

（1） ?Container是YARN中資源的抽象，它封裝了某個(gè)節(jié)點(diǎn)上一定量的資源（CPU和內(nèi)存兩類資源）。它跟Linux Container沒有任何關(guān)系，僅僅是YARN提出的一個(gè)概念（從實(shí)現(xiàn)上看，可看做一個(gè)可序列化/反序列化的Java類）。

（2） ?Container由ApplicationMaster向ResourceManager申請(qǐng)的，由ResouceManager中的資源調(diào)度器異步分配給ApplicationMaster；

（3） Container的運(yùn)行是由ApplicationMaster向資源所在的NodeManager發(fā)起的，Container運(yùn)行時(shí)需提供內(nèi)部執(zhí)行的任務(wù)命令（可以使任何命令，比如java、Python、C++進(jìn)程啟動(dòng)命令均可）以及該命令執(zhí)行所需的環(huán)境變量和外部資源（比如詞典文件、可執(zhí)行文件、jar包等）。

另外，一個(gè)應(yīng)用程序所需的Container分為兩大類，如下：

（1）運(yùn)行ApplicationMaster的Container：這是由ResourceManager（向內(nèi)部的資源調(diào)度器）申請(qǐng)和啟動(dòng)的，用戶提交應(yīng)用程序時(shí)，可指定唯一的ApplicationMaster所需的資源；

（2）運(yùn)行各類任務(wù)的Container：這是由ApplicationMaster向ResourceManager申請(qǐng)的，并由ApplicationMaster與NodeManager通信以啟動(dòng)之。

以上兩類Container可能在任意節(jié)點(diǎn)上，它們的位置通常而言是隨機(jī)的，即ApplicationMaster可能與它管理的任務(wù)運(yùn)行在一個(gè)節(jié)點(diǎn)上。

Container是YARN中最重要的概念之一，懂得該概念對(duì)于理解YARN的資源模型至關(guān)重要，希望本文對(duì)學(xué)習(xí)Container這一概念有所幫助。

原創(chuàng)文章，轉(zhuǎn)載請(qǐng)注明：?轉(zhuǎn)載自董的博客

本文鏈接地址:?http://dongxicheng.org/mapreduce-nextgen/understand-yarn-container-concept/

總結(jié)

以上是生活随笔為你收集整理的深入理解Hadoop YARN中的Container概念的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Hadoop与Spark常用配置参数总结
下一篇： Hadoop 2.0(YARN/HDFS

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

深入理解Hadoop YARN中的Container概念

總結(jié)