Spark _05Standalone模式两种提交任务方式
Standalone模式兩種提交任務(wù)方式
Standalone-client提交任務(wù)方式
- 提交命令
或者
./spark-submit --master spark://node1:7077 --deploy-mode client --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 100-
執(zhí)行原理圖解【完美圖示】
- 執(zhí)行流程
- 總結(jié)
client模式適用于測試調(diào)試程序。Driver進(jìn)程是在客戶端啟動(dòng)的,這里的客戶端就是指提交應(yīng)用程序的當(dāng)前節(jié)點(diǎn)。在Driver端可以看到task執(zhí)行的情況。生產(chǎn)環(huán)境下不能使用client模式,是因?yàn)?#xff1a;假設(shè)要提交100個(gè)application到集群運(yùn)行,Driver每次都會(huì)在client端啟動(dòng),那么就會(huì)導(dǎo)致客戶端100次網(wǎng)卡流量暴增的問題。
?Standalone-cluster提交任務(wù)方式
- 提交命令
-
執(zhí)行原理圖解【完美圖解】
- 執(zhí)行流程
- 總結(jié)
Driver進(jìn)程是在集群某一臺(tái)Worker上啟動(dòng)的,在客戶端是無法查看task的執(zhí)行情況的。假設(shè)要提交100個(gè)application到集群運(yùn)行,每次Driver會(huì)隨機(jī)在集群中某一臺(tái)Worker上啟動(dòng),那么這100次網(wǎng)卡流量暴增的問題就散布在集群上。
- 總結(jié)Standalone兩種方式提交任務(wù),Driver與集群的通信包括:
1. Driver負(fù)責(zé)應(yīng)用程序資源的申請
2. 任務(wù)的分發(fā)。
3. 結(jié)果的回收。
4. 監(jiān)控task執(zhí)行情況。
Yarn模式兩種提交任務(wù)方式
yarn-client提交任務(wù)方式
- 提交命令
或者
./spark-submit --master yarn–client--class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 100?或者
./spark-submit --master yarn --deploy-mode client --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 100-
執(zhí)行原理圖解【完美圖解】
?
- 執(zhí)行流程
- 總結(jié)
Yarn-client模式同樣是適用于測試,因?yàn)镈river運(yùn)行在本地,Driver會(huì)與yarn集群中的Executor進(jìn)行大量的通信,會(huì)造成客戶機(jī)網(wǎng)卡流量的大量增加.
- ApplicationMaster的作用:
注意:ApplicationMaster有l(wèi)aunchExecutor和申請資源的功能,并沒有作業(yè)調(diào)度的功能。
?yarn-cluster提交任務(wù)方式
- 提交命令
或者
./spark-submit --master yarn-cluster --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 100-
執(zhí)行原理圖解【完美圖解】
- 執(zhí)行流程
- 總結(jié)
Yarn-Cluster主要用于生產(chǎn)環(huán)境中,因?yàn)镈river運(yùn)行在Yarn集群中某一臺(tái)nodeManager中,每次提交任務(wù)的Driver所在的機(jī)器都是隨機(jī)的,不會(huì)產(chǎn)生某一臺(tái)機(jī)器網(wǎng)卡流量激增的現(xiàn)象,缺點(diǎn)是任務(wù)提交后不能看到日志。只能通過yarn(node:8042)查看日志。
- ApplicationMaster的作用:
- 停止集群任務(wù)命令:yarn application -kill applicationID
?
【注】感謝互聯(lián)網(wǎng),感謝B站北京某堂的老師的圖示。
總結(jié)
以上是生活随笔為你收集整理的Spark _05Standalone模式两种提交任务方式的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 大厂面试官最喜欢问的面试难点
- 下一篇: Spark _06_补充部分算子【一】