日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Flink分布式standalone部署方式(第一种方式)

發布時間:2024/9/16 编程问答 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Flink分布式standalone部署方式(第一种方式) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

提前準備

  • java 版本 1.8.0_101
  • flink 版本 flink-1.8.2-bin-scala_2.11.tgz
  • hadoop 版本 hadoop-2.8.5.tar.gz
  • flink-hadoop lib 版本 flink-shaded-hadoop-2-uber-2.6.5-7.0.jar
  • 配置環境變量

    JAVA_HOME=/usr/jdk1.8.0_101 FLINK_HOME=/home/iie4bu/app/flink-1.8.2 HADOOP_HOME=/home/iie4bu/app/hadoop-2.8.5 PATH=$JAVA_HOME/bin:$FLINK_HOME/bin:$HADOOP_HOME/bin:$PATH export PATH=$PATH

    Java安裝

    這里就不多說了,有很多資料,安裝后,檢查一下:

    flink 1.8.2 安裝

  • 解壓縮 tar -xvf flink-1.8.2-bin-scala_2.11.tgz
  • 修改flink-1.8.2/conf/flink-conf.yaml文件
    配置文件中常用的配置
    jobmanager.rpc.address參數用來指向master節點的地址
    jobmanager.heap.size 表示jobmanager節點可用的內存
    taskmanager.heap.size表示taskmanager節點可用的內存
    taskmanager.numberOfTaskSlots 每一個機器可用的CPU個數,決定了并行度
    paraparallelism.default 表示任務的并行度 可以在代碼層面覆蓋
    taskmanager.tmp.dirs taskmanager的臨時數據存儲目錄
    • 修改配置文件flink-1.8.2/conf/flink-conf.yaml內容如下:jobmanager.rpc.address: swarm-manager (修改為本服務器的主機名) io.tmp.dirs: /home/iie4bu/app/tmp/flink-tmp
  • 修改配置文件flink-1.8.2/conf/masters
    swarm-manager:8081
  • 修改配置文件flink-1.8.2/conf/slaves
    swarm-manager
  • 啟動集群./bin/start-cluster.sh
  • 瀏覽器中輸入地址http://swarm-manager:8081

    啟動成功!
  • hadoop 2.8.5 安裝

  • 解壓縮hadoop-2.8.5.tar.gz
  • 修改配置文件etc/hadoop/hadoop-env.sh
  • export JAVA_HOME=/usr/jdk1.8.0_101
  • 修改配置文件etc/hadoop/core-site.xml
  • <configuration><property><name>fs.defaultFS</name><value>hdfs://swarm-manager:9000</value></property> </configuration>
  • 修改配置文件etc/hadoop/hdfs-site.xml
  • <configuration><property><name>dfs.replication</name><value>1</value></property><property><name>hadoop.tmp.dir</name><value>/home/iie4bu/app/tmp/hadoop-tmp</value></property> </configuration>
  • 設置免密登錄
  • $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
  • 測試hdfs
    • 格式化文件系統:$ bin/hdfs namenode -format
    • 啟動namenode和datanode:sbin/start-dfs.sh

      瀏覽器中輸入地址:http://swarm-manager:50070
    • 測試文件上傳

      成功!

    Yarn安裝配置

  • 修改配置文件etc/hadoop/mapred-site.xml
  • <configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property> </configuration>
  • 修改配置文件:etc/hadoop/yarn-site.xml
  • <configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.scheduler.maximum-allocation-mb</name><value>10000</value></property><property><name>yarn.scheduler.minimum-allocation-mb</name><value>3000</value></property> </configuration>

    容器的最小內存和最大內存分別為:3000m和10000m
    3. 啟動ResourceManager 和NodeManager :sbin/start-yarn.sh

    4. 瀏覽器中輸入http://swarm-manager:8088

    啟動成功!

    配置Flink on Yarn

  • 首先在https://flink.apache.org/downloads.html#apache-flink-182下載對應的包
  • 然后將flink-shaded-hadoop-2-uber-2.6.5-7.0.jar拷貝至flink-1.8.2/lib/
  • 測試運行./bin/yarn-session.sh -n 1 -jm 1024m -tm 1024m


  • 提交Flink作業

  • wget -O LICENSE-2.0.txt http://www.apache.org/licenses/LICENSE-2.0.txt
  • ./hdfs dfs -put ~/LICENSE-2.0.txt /提交到hdfs中
  • ./bin/flink run ./examples/batch/WordCount.jar --input hdfs://swarm-manager:9000/LICENSE-2.0.txt --output hdfs://swarm-manager:9000/wordcount-result.txt執行這個作業
  • 瀏覽器中查看

    已經完成了一個作業了。
  • 查看結果 ./bin/hdfs dfs -ls /

    ./bin/hdfs dfs -text /wordcount-result.txt可以查看文件結果。
  • 總結

    以上是生活随笔為你收集整理的Flink分布式standalone部署方式(第一种方式)的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。