當前位置：首頁 >

Hadoop运行任务时一直卡在: INFO mapreduce.Job: Running job

發布時間：2025/3/11 32 豆豆

生活随笔收集整理的這篇文章主要介紹了 Hadoop运行任务时一直卡在: INFO mapreduce.Job: Running job 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

原文鏈接：http://blog.csdn.net/dai451954706/article/details/50464036

-----------------------------------------------------------------------------------------------------

　今天，一大清早同事就讓我幫他解決Hive的問題：他在Hive中執行簡單的查詢(直接從hive查詢數據，沒有MR過程)能很快的得到結果，但是執行復雜的查詢時，就一直卡著不動．我連到服務器上試了一下，跟他遇到的問題一樣，問題處在哪里呢？既然簡單的查詢能出結果，復雜查詢需要MR計算，但是卻卡住了，那估計是Hadoop的問題．

　　于是，我在Hadoop跑一個簡單的WountCound程序試試，結果跟Hive中遇到的情況一樣:

????

??? 然后就一直卡在這個界面，很久都沒有結果．

　最先想到的是：配置可能有點問題．于是我把配置檢查了一遍，發現配置沒錯．于是，我又去檢查Yarn和HDFS的啟動日志，也沒有發現ERROR.接著，我查看每個任務運行時的Container日志，也沒有Error．真是見鬼了！

　在我查看各種日志和配置的時候，我同事在Docker中，將集群上的配置Copy過去，試了一遍，能正常運行！這．．．

　然后，我各種百度，google，在百度出來的各種方法我都試了一遍，仍然沒有解決問題！于是，我同事說，是不是安裝的時候有些包損壞了．于是，他又重新裝了一邊Hadoop，還是使用原來的配置，可問題依舊！

　此時，都已經搞了一直整天了，還有一個小時就要下班了！于是，我在Google中看了幾篇文章，基本上上面所說的方法我都試了．終于，在Stackover上有一個哥們也遇到了同樣的問題，有人幫他解決了，里面鏈接到了一個網站:http://hortonworks.com/blog/how-to-plan-and-configure-yarn-in-hdp-2-0/? ,我打開一看，說的是要設置yarn里面關于內存和虛擬內存的配置項．我以前沒配置這幾項，也能正常運行，感覺是這個問題的可能性不大啊！但是，既然這么多方法都不管用，這能試一試了．　

　　于是，我在yarn-site.xml中加了:

??????

[plain]?view plaincopy

<property>??

????<name>yarn.nodemanager.resource.memory-mb</name>??

????<value>20480</value>??

</property>??

<property>??

???<name>yarn.scheduler.minimum-allocation-mb</name>??

???<value>2048</value>??

</property>??

<property>??

????<name>yarn.nodemanager.vmem-pmem-ratio</name>??

????<value>2.1</value>??

</property>??

? ?再次運行，居然成功了！

　然后運行Hive，也能正確的運行了！

? ? 出現此故障的原因應該是，在每個Docker分配的內存和CPU資源太少，不能滿足Hadoop和Hive運行所需的默認資源需求。

以上參數的配置詳解見博客：http://blog.csdn.net/zengmingen/article/details/52609893

總結

以上是生活随笔為你收集整理的Hadoop运行任务时一直卡在: INFO mapreduce.Job: Running job的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Hive与Hadoop的调用关系
下一篇：服务器oracle优化,oracle服务

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

Hadoop运行任务时一直卡在: INFO mapreduce.Job: Running job

總結