當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

hadoop3伪分布式安装

發布時間：2024/9/5 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了 hadoop3伪分布式安装小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、安裝hadoop

1、偽分布式模式

有namenode,datanode,resoucrcemanager,nodemanager等進程,這些進程運行在同一臺服務器上

2、ssh免密碼連接

執行命令:ssh-keygen -t rsa?一路回車即可

復制秘鑰到本地: cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

驗證?ssh?本機ip?成功

3、防火墻關閉

systemctl stop firewalld.service #停止firewall

systemctl disable firewalld.service #禁止firewall開機啟動

4、jdk安裝配置

安裝方式自行百度

驗證:java -version

5、Hadoop配置

解壓

命令:tar cvf hadoop-3.1.2.tar -C /ecapp ; mv hadoop-3.1.2 hadoop

二、配置文件

1、core-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

　　　　<name>fs.defaultFS</name>

　　　　<value>hdfs://192.168.0.143:9000</value> ??

　　</property>

　　　　<name>hadoop.tmp.dir</name>

　　　　<value>/data/hadoop/hdfs/meta</value> ??

　　</property> ???

</configuration>

mkdir -p data/hadoop/hdfs/meta

2、hdfs-site.xml

datanode?配置成多個目錄，每個目錄存儲的數據不一樣。類似多個DataNode

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

　　　　<name>dfs.replication</name>

　　</property>

????<property>

???????<name>dfs.name.dir</name>

???????<value>/data/hadoop/hdfs/namenode</value>

????</property>

?????? <name>dfs.datanode.data.dir</name>

?????? <value>/data/hadoop/hdfs/datanode1,/data/hadoop/hdfs/datanode2</value>

</property>

</configuration>

3、yarn-site.xml

<?xml version="1.0"?>

????

????<property>

????????<name>yarn.resourcemanager.hostname</name>

????????<value>192.168.0.143</value>

????</property>

????

????<property>

????????<name>yarn.nodemanager.aux-services</name>

????????<value>mapreduce_shuffle,spark_shuffle</value>

????</property>

????

????<property>

???????<name>yarn.nodemanager.aux-services.spark_shuffle.class</name>

???????<value>org.apache.spark.network.yarn.YarnShuffleService</value>

????</property>

????

????<property>

????????<description>Amount of physical memory, in MB, that can be allocated for containers.</description>

????????<name>yarn.nodemanager.resource.memory-mb</name>

????????<value>6000</value>

????</property>

????<property>

????????<description>The minimum allocation for every container request at the RM,

?????????????????????in MBs. Memory requests lower than this won't take effect,

?????????????????????and the specified value will get allocated at minimum.</description>

????????<name>yarn.scheduler.minimum-allocation-mb</name>

????????<value>512</value>

????</property>

????

????<property>

????????<description>The maximum allocation for every container request at the RM,

?????????????????????in MBs. Memory requests higher than this won't take effect,

?????????????????????and will get capped to this value.</description>

????????<name>yarn.scheduler.maximum-allocation-mb</name>

????????<value>6000</value>

????</property>

????

????<property>

???? <name>yarn.log-aggregation-enable</name>

???? <value>true</value>

????</property>

????<property>

???? <name>yarn.log-aggregation.retain-seconds</name>

???? <value>2592000</value>

????</property>

????

????<property>

???? <name>yarn.log.server.url</name>

???? <value>http://192.168.0.143:8988/jobhistory/logs</value>

????</property>

????

????<property>

???? <name>yarn.nodemanager.remote-app-log-dir</name>

???? <value>hdfs://192.168.0.143:9000/user/root/yarn-logs/</value>

????</property>

????

??<property>

????<description>Number of vcores that can be allocated

????for containers. This is used by the RM scheduler when allocating

????resources for containers. This is not used to limit the number of

????CPUs used by YARN containers. If it is set to -1 and

????yarn.nodemanager.resource.detect-hardware-capabilities is true, it is

????automatically determined from the hardware in case of Windows and Linux.

????In other cases, number of vcores is 8 by default.</description>

????<name>yarn.nodemanager.resource.cpu-vcores</name>

????<value>4</value>

??</property>

????

??<property>

????<description>The minimum allocation for every container request at the RM

????in terms of virtual CPU cores. Requests lower than this will be set to the

????value of this property. Additionally, a node manager that is configured to

????have fewer virtual cores than this value will be shut down by the resource

????manager.</description>

????<name>yarn.scheduler.minimum-allocation-vcores</name>

????<value>1</value>

??</property>

????

??<property>

????<description>The maximum allocation for every container request at the RM

????in terms of virtual CPU cores. Requests higher than this will throw an

????InvalidResourceRequestException.</description>

????<name>yarn.scheduler.maximum-allocation-vcores</name>

????<value>3</value>

??</property>

????

??<property>

????<name>yarn.application.classpath</name>

?<value>/ecapp/hadoop/etc/hadoop:/ecapp/hadoop/share/hadoop/common/lib/*:/ecapp/hadoop/share/hadoop/common/*:/ecapp/hadoop/share/hadoop/hdfs:/ecapp/hadoop/share/hadoop/hdfs/lib/*:/ecapp/hadoop/share/hadoop/hdfs/*:/ecapp/hadoop/share/hadoop/mapreduce/lib/*:/ecapp/hadoop/share/hadoop/mapreduce/*:/ecapp/hadoop/share/hadoop/yarn:/ecapp/hadoop/share/hadoop/yarn/lib/*:/ecapp/hadoop/share/hadoop/yarn/*</value>

??</property>

</configuration>

4、mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

　　<name>mapreduce.framework.name</name>

</property>

????<name>mapreduce.jobhistory.address</name>

????<value>192.168.0.143:10020</value>

</property>

????<name>mapreduce.jobhistory.webapp.address</name>

????<value>192.168.0.143:8988</value>

</property>

????<name>mapreduce.jobhistory.joblist.cache.size</name>

????<value>5000</value>

</property>

</configuration>

5、workers

localhost ??//?此處是配置的本機

6、hadoop-env.sh?

最后加入你的javahome

JAVA_HOME=/ecapp/jdk

三、linux環境配置

1、/etc/profile文件配置

export JAVA_HOME=/ecapp/jdk

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

# hadoop?相關配置

export HADOOP_HOME=/ecapp/hadoop

#export HADOOP_OPTS="-Djava.library.path=$HADOOP_PREFIX/lib:$HADOOP_PREFIX/lib/native"

export LD_LIBRARY_PATH=$HADOOP_HOME/lib/native

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"

#export HADOOP_ROOT_LOGGER=DEBUG,console

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$JAVA_HOME/bin

#hadoop-3.1.0必須添加如下5個變量否則啟動報錯，hadoop-2.x貌似不需要

export HDFS_NAMENODE_USER=root

export HDFS_DATANODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

2、應用一下環境: source /etc/profile

四、啟動服務

1、格式化NameNode

命令: hdfs namenode -format

中間沒有報錯并且最后顯示如下信息表示格式化成功

...

/************************************************************

SHUTDOWN_MSG: Shutting down NameNode at ecs-6531-0002

************************************************************/

如果格式化NameNode之后運行過hadoop，然后又想再格式化一次NameNode，那么需要先刪除第一次運行Hadoop后產生的VERSION文件，否則會出錯

2、啟動

start-all.sh?啟動所有服務,啟動日志在hadoop軟件目錄的logs下

3、jps查看服務進程

6662 Jps

9273 DataNode #hdfs worker節點

5465 SecondaryNameNode #hdfs備份節點

9144 NameNode #hdfs主節點

9900 NodeManager #yarn的worker節點

9575 ResourceManager #yarn的主節點

4、啟動歷史任務服務器

命令:mapred --daemon start historyserver

jps看到

12710 JobHistoryServer

五、web頁面

hdfs地址:http://192.168.0.143:9870/dfshealth.html#tab-overview

?

轉載于:https://www.cnblogs.com/charon2/p/11315433.html

總結

以上是生活随笔為你收集整理的hadoop3伪分布式安装的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

分布式

上一篇： postgresql语句
下一篇： Spark 系列（一）—— Spark简

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

hadoop3伪分布式安装

一、安裝hadoop

1、偽分布式模式

2、ssh免密碼連接

3、防火墻關閉

4、jdk安裝配置

5、Hadoop配置

二、配置文件

1、core-site.xml

2、hdfs-site.xml

3、yarn-site.xml

4、mapred-site.xml

5、workers

6、hadoop-env.sh?

三、linux環境配置

1、/etc/profile文件配置

2、應用一下環境: source /etc/profile

四、啟動服務

1、格式化NameNode

2、啟動

3、jps查看服務進程

4、啟動歷史任務服務器

五、web頁面

?

總結