日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Spark2.2.0 分布式离线搭建

發布時間:2025/5/22 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Spark2.2.0 分布式离线搭建 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、Spark簡介

Apache Spark 是專為大規模數據處理而設計的快速通用的計算引擎。Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源的類Hadoop MapReduce的通用并行框架,Spark,擁有Hadoop MapReduce所具有的優點;但不同于MapReduce的是——Job中間輸出結果可以保存在內存中,從而不再需要讀寫HDFS,因此Spark能更好地適用于數據挖掘與機器學習等需要迭代的MapReduce的算法。

Spark 是一種與 Hadoop 相似的開源集群計算環境,但是兩者之間還存在一些不同之處,這些有用的不同之處使 Spark 在某些工作負載方面表現得更加優越,換句話說,Spark 啟用了內存分布數據集,除了能夠提供交互式查詢外,它還可以優化迭代工作負載。

Spark 是在 Scala 語言中實現的,它將 Scala 用作其應用程序框架。與 Hadoop 不同,Spark 和 Scala 能夠緊密集成,其中的 Scala 可以像操作本地集合對象一樣輕松地操作分布式數據集。

盡管創建 Spark 是為了支持分布式數據集上的迭代作業,但是實際上它是對 Hadoop 的補充,可以在 Hadoop 文件系統中并行運行。通過名為 Mesos 的第三方集群框架可以支持此行為。Spark 由加州大學伯克利分校 AMP 實驗室 (Algorithms, Machines, and People Lab) 開發,可用來構建大型的、低延遲的數據分析應用程序。

2、部署準備

2.1、安裝包準備

  • spark-2.2.0-bin-hadoop2.6.tgz
  • jdk-8u161-linux-x64.tar.gz
  • scala-2.11.0.tgz

2.2、節點配置信息

2.3、節點資源配置信息

3、集群配置與啟動

3.1、安裝包上傳與解壓

操作節點:risen01

操作用戶:root

  • 上傳安裝包spark-2.2.0-bin-hadoop2.6.tgz,scala-2.11.0.tgz,jdk-8u161-linux-x64.tar.gz(如果已經存在則不需要此步驟)到 risen01節點下的~/packages目錄下,結果如圖所示:
  • 2、解壓JDK安裝包,Spark安裝包Scala安裝包和到/usr/local下

    操作節點:risen01

    操作用戶:root

    解壓JDK命令:

    tar -zxvf ~/packeages/jdk-8u161-linux-x64.tar.gz -C /usr/local

    解壓spark命令:

    tar -zxvf ~/packages/spark-2.2.0-bin-hadoop2.6.tgz -C /usr/local

    解壓Scala命令:

    tar -zxvf ~/packages/scala-2.11.0.tgz -C /usr/local

    3.2、啟動前準備

    操作節點:risen01,risen02,risen03

    操作用戶:root

  • 在/data目錄下新建立spark/work目錄用來存放spark的任務處理日志
  • 在/log目錄下新建立spark目錄用來存放spark的啟動日志等
  • 3.3、修改配置文件

    3.3.1、編輯spark-env.sh文件

    操作節點:risen01

    操作用戶:root

    說明:請根據實際集群的規模和硬件條件來配置每一項參數

    進入到/usr/local/spark-2.2.0-bin-hadoop2.6/conf目錄下執行命令:

    cp spark-env.sh.template spark-env.sh

    編輯spark-env.sh文件,添加以下內容:

    #設置spark的web訪問端口 SPARK_MASTER_WEBUI_PORT=18080#設置spark的任務處理日志存放目錄 SPARK_WORKER_DIR=/data/spark/work#設置spark每個worker上面的核數 SPARK_WORKER_CORES=2#設置spark每個worker的內存 SPARK_WORKER_MEMORY=1g#設置spark的啟動日志等目錄 SPARK_LOG_DIR=/log/spark#指定spark需要的JDK目錄 export JAVA_HOME=/usr/local/jdk1.8.0_161#指定spark需要的Scala目錄 export SCALA_HOME=/usr/local/scala-2.11.0#指定Hadoop的安裝目錄 export HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop#指定Hadoop的配置目錄 export HADOOP_CONF_DIR=/opt/cloudera/parcels/CDH/lib/hadoop/etc/hadoop/#實現spark-standlone HA(因為我們HA實現的是risen01和risen02之間的切換不涉及risen03,所以這段配置risen03可有可無) export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=risen01:2181,risen02:2181,risen03:2181 -Dspark.deploy.zookeeper.dir=/data/spark"

    3.3.2、 編輯spark-defaults.conf文件

    操作節點:risen01

    操作用戶:root

    說明:請根據實際集群的規模和硬件條件來配置每一項參數

    進入到/usr/local/spark-2.2.0-bin-hadoop2.6/conf目錄下執行命令:

    cp spark-defaults.conf.template spark-defaults.conf

    編輯spark-defaults.conf文件,添加以下內容:

    #設置spark的主節點 spark.master spark://risen01:7077#開啟eventLog spark.eventLog.enabled true#設置eventLog存儲目錄 spark.eventLog.dir /log/spark/eventLog#設置spark序列化方式 spark.serializer org.apache.spark.serializer.KryoSerializer#設置spark的driver內存 spark.driver.memory 1g#設置spark的心跳檢測時間間隔 spark.executor.heartbeatInterval 20s#默認并行數 spark.default.parallelism 20#最大網絡延時 spark.network.timeout 3000s

    3.3.3、 編輯slaves文件

    操作節點:risen01

    操作用戶:root

    說明:請根據實際集群的規模和硬件條件來配置每一項參數

    進入到/usr/local/spark-2.2.0-bin-hadoop2.6/conf目錄下執行命令:

    cp slaves.templete slaves

    編輯slaves文件,修改localhost為:

    risen01 risen02 risen03

    3.4、分發其他節點

  • 執行scp命令:
  • 操作節點:risen01

    操作用戶:root

    scp -r /usr/local/spark-2.2.0-bin-hadoop2.6 root@risen02:/usr/local scp -r /usr/local/scala-2.11.0 root@risen02:/usr/local scp -r /usr/local/jdk1.8.0_161 root@risen02:/usr/local scp -r /usr/local/spark-2.2.0-bin-hadoop2.6 root@risen03:/usr/local scp -r /usr/local/scala-2.11.0 root@risen03:/usr/local scp -r /usr/local/jdk1.8.0_161 root@risen03:/usr/local
  • 需要提前創建好bigdata用戶并實現免密(這里不再贅述,此步驟如果做過可不做)
  • 權限修改
  • 操作節點:risen01,risen02,risen03

    操作用戶:root

    修改/log/spark權限命令:

    chown -R bigdata.bigdata /log/spark

    修改/data/spark權限命令:

    chown -R bigdata.bigdata /data/spark

    修改spark的安裝目錄命令:

    chown -R bigdata.bigdata /usr/local/spark-2.2.0-bin-hadoop2.6

    修改Scala的安裝目錄命令:

    chown -R bigdata.bigdata /usr/local/scala-2.11.0

    修改JDK1.8的安裝目錄命令:(此步驟如果做過可不做)

    chown -R bigdata.bigdata /usr/local/jdk1.8.0_161

    結果如圖下所示:

    3.5、啟動集群

    操作節點:risen01,risen02

    操作用戶:bigdata

    (1) 進入到/usr/local/spark-2.2.0-bin-hadoop2.6/sbin目錄下執行./start-all.sh,查看web界面如下圖所示:

    然后在進入到risen02機器的spark安裝目錄下/usr/local/spark-2.2.0-bin-hadoop2.6/sbin執行命令./start-master.sh啟動spark集群的備用主節點。(記得一定要啟動備用主節點的進程,這里我們只用risen02做備用主節點,risen03雖然也配置了有資格,但是暫時我們不需要)

    (2) 進入到/usr/local/spark-2.2.0-bin-hadoop2.6/bin目錄下執行spark-shell,并測試統計詞頻的測試,結果如下圖所示:

    截止到此,spark-standlone模式便安裝成功了!

    推薦閱讀:https://www.roncoo.com/course/view/c4e0130ea2354c71a2cb9ba24348746c

    文章來源:https://my.oschina.net/blogByRzc/blog/1800450

    總結

    以上是生活随笔為你收集整理的Spark2.2.0 分布式离线搭建的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 久久国产精品波多野结衣 | 欧美性大战久久久久久久 | 四虎精品一区二区 | 中日韩免费毛片 | 亚洲精品久久久久久久久久久 | 丁香激情五月少妇 | 玖玖热在线视频 | 成人黄色网页 | 成人3d动漫一区二区三区91 | 欧美人与性动交α欧美精品 | 国产3页 | 日本少妇激情舌吻 | 精品视频中文字幕 | 久色视频 | 亚洲成人毛片 | 97爱爱| 亚洲国产中文字幕在线观看 | 亚洲怡红院av | 日本福利视频导航 | 91久久久久久久 | 最新自拍偷拍 | 黄色大片网 | 美女隐私免费网站 | 偷拍老头老太高潮抽搐 | 中字幕视频在线永久在线观看免费 | 久久久精品电影 | 91精品国产电影 | 神马午夜麻豆 | 91影音 | 亚洲国产精品免费视频 | 雷电将军和丘丘人繁衍后代视频 | 小伸进喷水网站 | 亚洲砖区免费 | 91精品国产成人www | 午夜激情影院 | 精品一区二区三区免费毛片爱 | 亚洲av无码一区二区二三区软件 | 91在线 | 国内黄色片 | 天天干天天爽天天操 | 在线免费看av | 丝袜诱惑一区二区 | 免费小视频 | 国产精品乱码久久久久久久久 | 永久免费在线视频 | 性奶老妇 视频 | 日韩精品午夜 | 美女交配| 欧美日韩久久婷婷 | 中文字幕在线播放日韩 | 久久久久国产精品熟女影院 | 久久久剧场 | 亚洲欧美日韩高清 | 日本一区不卡在线观看 | 97av.com| 欧美日韩少妇 | 欧美女优一区二区 | 激情五月婷婷在线 | www国产黄色 | 床戏高潮做进去大尺度视频网站 | 成人在线超碰 | 在线第一页 | 一本加勒比hezyo黑人 | 国产亚洲自拍av | 亚洲精品久久一区二区三区777 | 国产一级全黄 | 91叉叉叉 | 国产成人精品无码免费看81 | 91精东传媒理伦片在线观看 | 免费视频日韩 | 久久精品国产亚洲AV成人雅虎 | 国产a级黄色 | 亚洲一区二区三区四区不卡 | 91重口味| 国产第六页 | 国产精品 欧美 日韩 | 日本天堂在线播放 | 国产一区免费看 | 国产精品人人爽 | 三级黄毛片 | 亚洲国产精品久久久久久6q | 女女互慰吃奶互揉调教捆绑 | 午夜视频在线观看网站 | 青青草97国产精品免费观看 | 欧美性第一页 | 伊人国产在线观看 | 19禁大尺度做爰无遮挡电影 | 久久接色 | 国产超91 | 蜜桃91麻豆精品一二三区 | 国产精品无码久久久久久电影 | 国产精品久久久久久亚洲伦 | 热热色原网址 | 久久成人免费 | 开元在线观看视频国语 | 午夜免费观看 | 国产一区二区三区在线视频 | 亚洲免费观看高清 | 日韩一区欧美二区 |