日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > Ubuntu >内容正文

Ubuntu

ubuntu下安装配置hadoop

發布時間:2025/3/21 Ubuntu 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ubuntu下安装配置hadoop 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

hadoop框架

Hadoop使用主/從(Master/Slave)架構,主要角色有NameNode,DataNode,secondary NameNode,JobTracker,TaskTracker組成。

其中NameNode,secondary NameNode,JobTracker運行在Master節點上,DataNode和TaskTracker運行在Slave節點上。

?

1,NameNode

NameNode是HDFS的守護程序,負責記錄文件是如何分割成數據塊的,以及這些數據塊被存儲到哪些數據節點上。它的功能是對內存及I/O進行集中管理。

2,DataNode

集群中每個從服務器都運行一個DataNode后臺程序,后臺程序負責把HDFS數據塊讀寫到本地文件系統。需要讀寫數據時,由NameNode告訴客戶端去哪個DataNode進行具體的讀寫操作。

3,Secondary NameNode

Secondary NameNode是一個用來監控HDFS狀態的輔助后臺程序,如果NameNode發生問題,可以使用Secondary NameNode作為備用的NameNode。

4,JobTracker

JobTracker后臺程序用來連接應用程序與Hadoop,用戶應用提交到集群后,由JobTracker決定哪個文件處理哪個task執行,一旦某個task失敗,JobTracker會自動開啟這個task。

4,TaskTracker

TaskTracker負責存儲數據的DataNode相結合,位于從節點,負責各自的task。

?

hadoop的安裝

1)安裝SSH

sudo apt-get install ssh

2)安裝java

3)安裝hadoop

下載并解壓縮

tar -zxvf hadoop-0.21.0.tar.gz

4)改變配置

指定java安裝路徑

使用vi

vi conf/hadoop-env.sh

添加

export JAVA_HOME = /usr/java/jdk1.7.0_01

可以使用三種模式安裝,測試階段可以使用單機模式。

在啟動的時候可能會遇到很多問題,比如 22 connection refused

可以安裝openssh,使用apt-get

sudo apt-get install openssh-client

sudo apt-get install openssh-server

sudo apt-get install chkconfig

使用chkconfig --list | grep sshd查看服務是否啟動

使用ssh localhost

出現如下提示

輸入密碼后

出現歡迎頁面,配置成功

免密碼登錄

ssh-keygen -t rsa

進入.ssh目錄

執行

cp id_rsa.pub authorized_keys

重新ssh localhost,可以不輸入密碼

?

單機偽分布式:

進入目錄/hadoop/conf

編輯 ~/hadoop/conf/core-site.xml

<configuration> ??<property> ????<name>fs.default.name</name> ????<value>hdfs://localhost:9000</value> ??</property> ??<property> ????<name>hadoop.tmp.dir</name> ????<value>/tmp/hadoop/hadoop-${user.name}</value> ??</property> </configuration>
編輯 ~/hadoop/conf/hdfs-site.xml
<configuration> ??<property> ????<name>dfs.replication</name> ????<value>1</value> ??</property> </configuration>
編輯 ~/hadoop/conf/mapred-site.xml
<configuration> ??<property> ????<name>mapred.job.tracker</name> ????<value>localhost:9001</value> ??</property> </configuration>

然后進入hadoop/bin目錄

執行 ./hadoop namenode -format

執行start-all.sh

啟動完成

打開瀏覽器,輸入http://localhost:50030

就可以看到如下界面

運行示例 bin/hadoop jar hadoop-mapred-examples-0.21.0.jar wordcount in out

得到輸出結果,配置成功!

?

安裝eclipse插件

插件的路徑在0.21下有所更改,路徑如下

將插件拷到eclipse pluglin目錄下

重啟eclipse

啟動后多出一個目錄

就可以使用eclipse進行編程了。

?

?

hadoop使用:
  • hadoop使用(一)
  • hadoop使用(二)
  • hadoop使用(三)
  • hadoop使用(四)
  • hadoop使用(五)
  • hadoop使用(六)
  • hbase實戰:
  • hbase實戰——(1.1? nosql介紹)
  • 總結

    以上是生活随笔為你收集整理的ubuntu下安装配置hadoop的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。