hadoop--Yarn资源调度器的基础架构、工作机制 与 作业提交全过程
生活随笔
收集整理的這篇文章主要介紹了
hadoop--Yarn资源调度器的基础架构、工作机制 与 作业提交全过程
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
- 一、Yarn資源調度器
- Yarn 基礎架構
- 二、YARN工作機制
- 三、作業提交全過程
- 1. HDFS、YARN、MapReduce三者關系
- 2. 作業提交過程(YARN)
- 3. 作業提交過程(HDFS & MapReduce)
一、Yarn資源調度器
??:YARN是一個資源調度平臺,負責為運算程序提供服務器運算資源,相當于一個分布式的操作系統平臺,而MapReduce等運算程序則相當于操作系統上的應用程序。
作用:
YARN負責管理集群資源;
負責給任務合理分配資源。
Yarn 基礎架構
YARN主要由ResourceManager、NodeManager、ApplicationMaster和Container等組件構成。
二、YARN工作機制
三、作業提交全過程
1. HDFS、YARN、MapReduce三者關系
2. 作業提交過程(YARN)
3. 作業提交過程(HDFS & MapReduce)
HDFS的讀寫數據流程==>
作業提交全過程:
- 一、作業提交
- 二、作業初始化
- 三、任務分配
- 四、任務運行
- 五、進度和狀態更新
YARN中的任務將其進度和狀態(包括counter)返回給應用管理器,客戶端每秒(通過 mapreduce.client.progressmonitor.pollinterval 設置)向應用管理器請求進度更新,展示給用戶。
- 六、作業完成?
除了向應用管理器請求作業進度外,客戶端每5秒都會通過調用waitForCompletion()方法來檢查作業是否完成。時間間隔可以通過mapreduce.client.completion.pollinterval 來設置。作業完成之后,應用管理器和Container會清理工作狀態,作業的信息會被歷史服務器存儲以備后續用戶核查。
總結
以上是生活随笔為你收集整理的hadoop--Yarn资源调度器的基础架构、工作机制 与 作业提交全过程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【译】Activitys, Thread
- 下一篇: 如何用 ajax 连接mysql数据库,