日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 前端技术 > javascript >内容正文

javascript

Spring XD用于数据提取

發布時間:2023/12/3 javascript 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Spring XD用于数据提取 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Spring XD是一個功能強大的工具,它是一組可安裝的Spring Boot服務,可以獨立運行,在YARN或EC2之上運行。 Spring XD還包括一個管理UI網站和一個用于作業和流管理的命令行工具。 Spring XD是一組功能強大的服務,可與各種數據源一起使用。

為了達到理想的使用效果,它應該在Apache Spark或Hadoop集群中運行。 在第一部分中,我們將設置XD使其在具有必要數據服務的Centos / RHEL機器上運行。 這些用于運行所需的基礎結構以及數據攝取。 您可以集成現有的RDBMS,MongoDB,Kafka,Apache Spark,Hadoop,REST,RabbitMQ和其他服務。

您還可以在Mac,Windows和其他Linux發行版上安裝XD。 對于開發人員機器上的基本用法,只需從Spring.IO網站下載Spring XD并運行xd / xd / bin / xd-standalone,這足以運行數據提取。

1. Spring XD設置

首先,讓我們在您的Linux服務器上安裝Spring XD,注意其運行要求。 如果您沒有所需的服務,則XD下載包含它們的版本供您運行。

參考:

  • http://docs.spring.io/spring-xd/docs/current/reference/html/#_redhat_centos_installation
  • https://github.com/spring-projects/spring-xd/wiki/Running-Distributed-Mode
  • https://github.com/spring-projects/spring-xd/wiki/XD-Distributed-Runtime

要求:

  • Apache Zookeeper 3.4.6
  • 雷迪斯
  • RDBMS(MySQL,Postgresql,Apache Derby等)

濃縮機:

  • GemFire(強烈建議用于內存數據網格)
  • GemFire XD(強烈建議用于內存數據庫)
  • RabbitMQ(強烈推薦)
  • 阿帕奇紗線

在Centos / RHEL / Fedora上安裝MySQL

需要一個關系數據庫來存儲您的工作信息,而可以使用內存中的RDBMS,但為了實際使用,應使用RDBMS。 如果您有可從XD群集訪問的RDBMS,則可以使用它。 我更喜歡將開放源代碼數據庫僅用于XD,您可以為此安裝MySQL或Postgresql。

sudo yum install mysql-server
  • http://dev.mysql.com/downloads/repo/yum/

安裝Postgresql(不要與GreenPlum安裝在同一臺計算機上)

sudo yum install postgresql-server

安裝Redis

  • http://redis.docs.pivotal.io/doc/2x/index.html#getting-started/src/install.html #topic_q3g_vzs_yn

(請參閱RabbitMQ)

ᅠwget -q -O – http://packages.pivotal.io/pub/rpm/rhel6/app-suite/app-suite-installer | sh ᅠ ᅠ ᅠ ᅠ ᅠ ᅠsudo yum install pivotal-redis ᅠ ᅠ ᅠ ᅠ ᅠ ᅠsudo service pivotal-redis-6379 start ᅠ ᅠ ᅠ ᅠ ᅠ ᅠsudo chkconfig —level 35 pivotal-redis-6379 on

安裝RabbitMQ

即使您有另一個消息隊列,也需要RabbitMQ。 單個節點就足夠了,但是通信需要它。 我強烈建議您使用真正的RMQ群集,因為它適合大多數流媒體需求。

  • http://rabbitmq.docs.pivotal.io/doc/33/index.html#getstart/src/install-getstart.html #安裝,RHEL
ᅠ sudo wget -q -O – packages.pivotal.io | sh sudo wget -q -O – http://packages.pivotal.io/pub/rpm/rhel6/app-suite/app-suite-installer | sh

根據權限的不同,您可能必須將其發送到文件,將其更改為chmod 700并通過sudo ./installer.sh運行。

ᅠ sudo yum search pivotalpivotal-rabbitmq-server.noarch: The RabbitMQ serversudo yum install pivotal-rabbitmq-server sudo rabbitmq-plugins enable rabbitmq_management ᅠ ᅠ

如果您正在該計算機上運行其他內容,則可能與端口沖突。

ᅠ sudo /sbin/service rabbitmq-server start

安裝Spring-XD

最簡單的安裝方法是使用Pivotal的RHEL官方版本,因為它們已通過認證。 您不需要成為客戶就可以使用它們。 還有許多其他方式來下載/安裝XD,但這對于RHEL是最簡單的,因為它將配置它們為服務。

sudo wget -q -O – http://packages.pivotal.io/pub/rpm/rhel6/app-suite/app-suite-installer sh sudo yum install spring-xd

建議

還建議在同一容器內部署XD節點和DataNode并使用數據分區。 這將加速數據處理和提取。

設置工作數據庫

更改數據源,選擇以下一項以進行最簡單的設置。 作業數據庫是存儲Spring XD作業信息和元數據的地方。 這是必要的。 這將是非常少量的數據。

/opt/pivotal/spring-xd/xd/config ᅠ#spring: # ᅠdatasource: # ᅠ ᅠurl: jdbc:mysql://mysqlserver:3306/xdjobs # ᅠ ᅠusername: xdjobsschema # ᅠ ᅠpassword: xdsecurepassword # ᅠ ᅠdriverClassName: com.mysql.jdbc.Driver # ᅠ ᅠvalidationQuery: select 1 #Config for use with Postgres - uncomment and edit with relevant values for your environment #spring: # ᅠdatasource: # ᅠ ᅠurl: jdbc:postgresql://postgresqlserver:5432/xdjobs # ᅠ ᅠusername: xdjobsschema # ᅠ ᅠpassword: xdsecurepassword # ᅠ ᅠdriverClassName: org.postgresql.Driver # ᅠ ᅠvalidationQuery: select 1

測試Spring-XD單節點是否正常工作:

cd /opt/pivotal/springxd/xd/bin ./xd-singlenode —hadoopDistro phd20

如果您使用的是與Pivotal HD 2.0不同的Hadoop發行版,則可以在此處指定該標記或將其保留為關閉狀態。

測試Spring-XD Shell是否有效

cd /opt/pivotal/springxd/shell/bin ᅠ ᅠ ./xd-shell—hadoopDistro phd20

該外殼程序具有幫助和快捷方式,只需開始鍵入,Tab即可為您解析名稱和參數。

設置Spring XD的環境變量

export XD_HOME=/opt/pivotal/spring-xd/xd

對于默認訪問,我使用:

/opt/pivotal/spring-xd/shell/bin/xd-shell —hadoopDistro phd20

用于測試分布式Spring XD(DIRT)的容器和管理服務器

sudo service spring-xd-admin start sudo service spring-xd-container start

用于測試Spring XD

  • http://blog.pivotal.io/pivotal/products/spring-xd-for-real-time-analytics
  • https://github.com/spring-projects/spring-xd-samples

一些Spring XD Shell命令進行測試

had config fs —namenode hdfs://pivhdsne:8020 admin config server http://localhost:9393 runtime containers runtime moduleshadoop fs ls /xd/ stream create ticktock —definition “time | log” stream deploy ticktock stream list

檢查網頁界面

  • http:// localhost:9393 / admin-ui /#/ streams / definitions

2. Spring XD Job and Stream with SQL

注意:為了節省空間,完整的字段列表被縮寫,您必須列出所有正在使用的字段。

首先,我們創建一個簡單的filejdbc Spring Job,它將原始代字號分隔的文件加載到HAWQ中 。 這些字段都以TEXT字段形式出現,出于某些目的,這可能是可以的,但對于我們的需求而言不是。 我們還使用自定義接收器(請參閱XML,無編碼)創建XD流,該流運行SQL命令從該表插入并轉換為其他HAWQ類型(例如數字和時間)。

我們通過命令行REST POST觸發輔助流,但是我們可以使用定時觸發或許多其他方式(自動,腳本或手動)來啟動輔助流。 您也可以只創建一個自定義XD作業,該作業完成類型的轉換和一些操作,或者通過Groovy腳本轉換完成。 XD中有很多選項。

jobload.xd

job create loadjob --definition "filejdbc --resources=file:/tmp/xd/input/files/*.* --names=time,userid,dataname,dataname2, dateTimeField, lastName, firstName, city, state, address1, address2 --tableName=raw_data_tbl --initializeDatabase=true --driverClassName=org.postgresql.Driver --delimiter=~ --dateFormat=yyyy-MM-dd-hh.mm.ss --numberFormat=%d --username=gpadmin --url=jdbc:postgresql:gpadmin" --deploy stream create --name streamload --definition "http | hawq-store" --deploy job launch jobload clear job list stream list
  • 作業將包含所有文本列的文件加載到Raw HAWQ表中。
  • 流是由網頁命中或命令行調用觸發的
  • (需要hawq-store)。 這確實會插入到實際表中并截斷臨時表。

  • triggerrun.sh(用于測試的BASH Shell腳本)

    curl -s -H "Content-Type: application/json" -X POST -d "{id:5}" http://localhost:9000

    將spring-integration-jdbc jar添加到/ opt / pivotal / spring-xd / xd / lib

    hawq-store.xml(Spring集成/ XD配置)

    /opt/pivotal/spring-xd/xd/modules/sink/hawq-store.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:int="http://www.springframework.org/schema/integration"xmlns:int-jdbc="http://www.springframework.org/schema/integration/jdbc"xmlns:jdbc="http://www.springframework.org/schema/jdbc"xsi:schemaLocation="http://www.springframework.org/schema/beanshttp://www.springframework.org/schema/beans/spring-beans.xsdhttp://www.springframework.org/schema/integrationhttp://www.springframework.org/schema/integration/spring-integration.xsdhttp://www.springframework.org/schema/integration/jdbchttp://www.springframework.org/schema/integration/jdbc/spring-integration-jdbc.xsd"> <int:channel id="input" /> <int-jdbc:store-outbound-channel-adapterchannel="input" query="insert into real_data_tbl(time, userid, firstname, ...) select cast(time as datetime), cast(userid as numeric), firstname, ... from dfpp_networkfillclicks" data-source="dataSource" /> <bean id="dataSource" class="org.springframework.jdbc.datasource.DriverManagerDataSource"><property name="driverClassName" value="org.postgresql.Driver"/><property name="url" value="jdbc:postgresql:gpadmin"/><property name="username" value="gpadmin"/><property name="password" value=""/> </bean> </beans>

    createtable.sql

    CREATE TABLEᅠraw_data_tbl(time text,userid text , ...somefieldᅠtext)WITH (APPENDONLY=true)DISTRIBUTED BY (time);

    3. Shell的Spring XD腳本

    我的常規安裝腳本(我將其保存在setup.xd中,并通過 script –file setup.xd加載它)

    had config fs --namenode hdfs://localhost:8020 admin config server http://localhost:9393 hadoop fs ls / stream list

    通過Spring-XD將文件加載到GemFireXD的腳本

    stream create --name fileload --definition "file --dir=/tmp/xd/input/load --outputType=text/plain | ᅠjdbc --tableName=APP.filetest --columns=id,name" --deploy

    4. GemFire XD的Spring XD配置

    將GemFire XD JDBC驅動程序復制到Spring-XD(可能也需要tools.jar)

    cp /usr/lib/gphd/Pivotal_GemFireXD_10/lib/gemfirexd-client.jar /opt/pivotal/spring-xd/xd/lib/

    修改接收器的JDBC屬性以指向您的Gemfire XD,如果您使用的是Pivotal HD VM并安裝帶有Yum的Spring-XD(sudo yum update spring-xd),則此位置:

    /opt/pivotal/spring-xd/xd/config/modules/sink/jdbc/jdbc.properties url = jdbc:gemfirexd://localhost:1527 username = gfxd password = gfxd driverClassName = com.pivotal.gemfirexd.jdbc.ClientDriver

    對于Peer Client Driver,您需要GemFireXD Lib(.so二進制文件)中的更多文件,鏈接可能是一個好主意。

    5. GemFire XD設置

    gfxd connect client 'localhost:1527';create table filetest (id int, name varchar(100)) REPLICATE PERSISTENT; select id, kind, netservers from sys.members;ᅠ select * from filetest;

    Spring XD命令

    stream list

    顯示你的流

    參考:

    • Spring XD文檔
    • Spring XD Wiki
    • 在Centos上安裝Spring XD
    • GemFire XD文檔
    • Spring XD文件 提取 到JDBC中
    • 帶有Hadoop的Spring XD

    6.通過Spring XD將數據從RabbitMQ導入RDBMS

    從名為“ rq”的Rabbit隊列讀取的簡單流,并將其發送到“消息和主機”列的SQL數據庫,從而創建名為“ rq”的新表。

    stream create --name rq --definition "rabbit --outputType=text/plain | jdbc --columns='message,host' --initializeDatabase=true" --deploy

    7.通過Spring XD將數據從REST API導入HDFS

    stream create --name hdfssave --definition "http | hdfs" –deploy

    翻譯自: https://www.javacodegeeks.com/2015/03/spring-xd-for-data-ingestion.html

    總結

    以上是生活随笔為你收集整理的Spring XD用于数据提取的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 欧美激情精品久久久久久蜜臀 | 四虎4hu| 老女人乱淫 | 先锋影音中文字幕 | 一本到在线 | 九九热视频精品在线观看 | 亚洲一区久久久 | 欧美色图亚洲激情 | 欧美中文字幕在线 | 天堂аⅴ在线最新版在线 | www.狠狠干| 欧美三级手机在线观看 | 久久久久99精品成人片我成大片 | 全球av在线 | 日日综合 | 午夜精品久久久久久久久久久 | 国产伦精品一区二区三区视频免费 | 亚洲三区av| 色婷婷久久综合中文久久蜜桃av | 久久不射影院 | 麻豆视频免费看 | 一区二区三区四区国产精品 | 三级福利 | 亚洲国产毛片aaaaa无费看 | 黄色a毛片 | 黑人一级片 | 在线国产一区二区 | 可以免费看的黄色网址 | 成人在线免费视频播放 | 爽爽影院在线 | 91色在线播放 | 日韩日韩 | 久久久久亚洲av成人网人人网站 | 精品在线一区 | 国产精品一区一区三区 | 五月婷婷深深爱 | 熟女俱乐部一区二区 | 日本午夜网站 | 99久久精品国产一区二区三区 | 亚洲AV无码精品久久一区二区 | 97av在线视频 | 国产做爰免费视频观看 | 中文字幕人妻精品一区 | 性活交片大全免费看 | 国产麻豆一精品一av一免费 | 日本在线观看免费 | 欧美小视频在线观看 | 成人在线免费网站 | 欧美成人性色 | 亚洲精品美女网站 | 色婷婷综合视频 | 久久久久99人妻一区二区三区 | 国产伦精品一区二区三区免费视频 | 日日夜夜精品免费 | www.桃色 | 国产裸体视频网站 | 国产丰满美女做爰 | 免费黄视频网站 | 久久av高潮av | 国产黄色一区二区三区 | 久久精品国产99久久久 | 吊视频一区二区三区 | 午夜视频免费观看 | 国产中文字幕一区二区三区 | 香蕉视频成人在线观看 | 宅男噜噜噜 | 毛片黄色片 | a毛毛片 | 国产精品久久久久久一区二区三区 | 欧美亚洲精品在线 | 精品久久久一区 | 华丽的外出在线观看 | 国产精品福利在线观看 | 在线观看中文字幕一区 | 极品少妇网站 | 精品国产一区二区三区四区阿崩 | 亚洲国产成人精品视频 | 性久久久 | 强迫凌虐淫辱の牝奴在线观看 | 国产一区二区三区精品愉拍 | 91精产品一区观看 | v天堂在线观看 | 老司机在线精品视频 | 奇米影视第四色888 免费观看a毛片 | 天天躁日日摸久久久精品 | 亚洲av无码久久忘忧草 | 四虎影视永久免费 | av在线不卡网 | 97人人爽人人爽人人爽 | 亚洲精品日韩av | 久久久高清免费视频 | 免看一级片 | h在线观看视频 | 黄色网日本| 欧美少妇15p | 国产免费中文字幕 | 无码日韩精品一区二区 | 高跟91娇喘 | 欧美天天|