日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

使用Talend Open Studio将数据分步从oracle导入到hive中

發布時間:2025/3/20 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 使用Talend Open Studio将数据分步从oracle导入到hive中 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

先使用Tos建立模型,將Oracle中的數據導入到本地:

build job后,形成獨立可以運行的程序:

將生成的zip文件,上傳到hadoop集群上,有hive環境的機器上:

[hive@h1 work]$ ls file.zip jobInfo.properties join lib [hive@h1 work]$ cd join/ [hive@h1 join]$ ls bigdatademo items join_0_1.jar join_run.bat join_run.sh src user_activity2 [hive@h1 join]$ pwd /home/work/join [hive@h1 join]$ ls bigdatademo items join_0_1.jar join_run.bat join_run.sh src user_activity2 [hive@h1 join]$ pwd /home/work/join [hive@h1 join]$ ./join_run.sh > user_activity2 2>&1 &

這樣就得到了SQL語句執行的結果,存放在user_activity2中。

hive建表語句:

?

hive> show create table user_activity2; OK CREATE TABLE `user_activity2`(`user_id` string, `user_name` string, `sex` string, `age` string, `reg_hosp` string, `reg_community` string, `type` string, `disease_code` string, `disease` string, `doctor` string, `hosp_name` string, `service_id` string, `drug_id` string, `drug_name` string, `antibiotic` string, `hormone` string, `source` string, `base_drug` string, `community` string, `date` string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' LOCATION'hdfs://h1:8020/apps/hive/warehouse/cyw.db/user_activity2' TBLPROPERTIES ('transient_lastDdlTime'='1435547544') Time taken: 0.288 seconds, Fetched: 31 row(s)

將數據導入到hive表中:load data local inpath './user_activity2' into table user_activity2;

hive> show tables; OK Time taken: 0.794 seconds hive> use cyw; OK Time taken: 0.256 seconds hive> show tables; OK user_activity user_activity2 Time taken: 0.136 seconds, Fetched: 2 row(s) hive> load data local inpath './user_activity2' into table user_activity2; Loading data to table cyw.user_activity2 Table cyw.user_activity2 stats: [numFiles=1, totalSize=216927483] OK Time taken: 10.898 seconds hive> select * from user_activity2; OK F805418B-335F-4CA3-A209-7C9655148146 余澤英 2 47 成都高新區合作社區衛生服務中心 合作 1 急性支氣管炎 譚萬龍 成都高新區合作社區衛生服務中心 1E972231-C65A-4CE3-9233-8EA1B18058DE 滅菌注射用水 d875aacf-4723-4777-91ec-12d63732b58f 0 0 其他 合作 2014-02-27 F805418B-335F-4CA3-A209-7C9655148146 余澤英 2 47 成都高新區合作社區衛生服務中心 合作

查詢語句:

select a.個人id,b.姓名,b.性別,round((sysdate - b.出生日期) / 365) as fage,b.建檔單位,replace(replace(replace(b.建檔單位, '高新區'), '社區衛生服務中心'),'成都') 建檔社區,1 as ftype,a.問題編碼,a.問題名稱,a.處理醫生,c.機構名,a.服務記錄id,f.名稱,f.id 藥品ID ,f.抗生素, f.激素類藥,case when f.藥品來源 is null then '其他' else f.藥品來源 end 藥品來源, f.基藥分類,replace(replace(replace(c.機構名, '高新區'), '社區衛生服務中心'),'成都') 診療社區, to_char(a.發現日期, 'yyyy-mm-dd') 診療日期from ZLCHS.個人問題列表 a,ZLCHS.個人信息 b,ZLCHS.服務活動記錄 c,(select d.事件id, e.名稱, e.id, h.藥品來源, h.基藥分類, g.抗生素, g.激素類藥from ZLCHS.個人費用記錄 d, ZLCHS.收費項目目錄 e, ZLCHS.藥品規格 h, ZLCHS.藥品特性 gwhere d.收費項目id = e.idand d.收據費目 in ('西藥費', '中草藥費', '中成藥費')and h.藥品id(+) = e.idand h.藥名id = g.藥名id) f where a.個人id = b.id(+)and a.服務記錄id = c.id(+)and a.服務記錄id = f.事件id(+)

?

加入分區字段:

CREATE TABLE `user_activity`(`user_id` string, `user_name` string, `sex` string, `age` string, `reg_hosp` string, `reg_community` string, `type` string, `disease_code` string, `disease` string, `doctor` string, `hosp_name` string, `service_id` string, `drug_id` string, `drug_name` string, `antibiotic` string, `hormone` string, `source` string, `base_drug` string, `community` string, `date` string) PARTITIONED BY ( `dt` string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' LOCATION'hdfs://h1:8020/apps/hive/warehouse/cyw.db/user_activity' TBLPROPERTIES ('transient_lastDdlTime'='1435559269') Time taken: 0.252 seconds, Fetched: 33 row(s)

?

默認的字段分隔符為ascii碼的控制符\001,建表的時候用fields terminated by '\001',如果要測試的話,造數據在vi 打開文件里面,用ctrl+v然后再ctrl+a可以輸入這個控制符\001。按順序,\002的輸入方式為ctrl+v,ctrl+b。以此類推。

?

?

總結

以上是生活随笔為你收集整理的使用Talend Open Studio将数据分步从oracle导入到hive中的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 久久久99精品国产一区二区三区 | 肉色欧美久久久久久久免费看 | 国产乱码精品一区二区 | 91看片免费 | 日韩激情视频在线观看 | 超碰免费观看 | 久久精品亚洲一区 | 能在线观看的av | 精品国产免费人成在线观看 | 91精品国| 激情综合网五月激情 | 99久久国产宗和精品1上映 | 欧美另类精品 | 精品在线一区二区三区 | 亚洲视频小说 | 久久免费电影 | 五月婷婷婷 | 欧美日韩五月天 | 国产高清免费av | 超碰97免费 | av伊人久久 | 黄片毛片 | 色欧美在线| 中文字幕9| 免费h片在线观看 | 天天舔日日操 | 午夜视频大全 | 日韩一区二区精品视频 | 国产人人草 | 亚洲永久无码精品 | 18禁免费无码无遮挡不卡网站 | 日本色站| 天天操妹子 | 日韩在线国产 | 特级丰满少妇一级aaaa爱毛片 | 亚洲欧美在线不卡 | 一区二区三区 中文字幕 | 成人黄色激情 | 亚洲精品国产一区二 | 国产精品自拍在线 | 国产日韩一区二区三区在线观看 | 欧美成人精品在线 | 蜜桃视频一区二区三区在线观看 | 美女视频黄色在线观看 | 在线播放亚洲 | 激情草逼 | 国产又黄视频 | www国产黄色 | 中日一级片 | 波多野结衣在线观看一区 | 中文字幕av专区dvd | 成人在线91| 日美毛片| 天堂久久网 | 扶她futa粗大做到怀孕 | 自拍偷拍 亚洲 | 污污内射在线观看一区二区少妇 | 香蕉视频毛片 | 欧美日韩一区二区在线观看视频 | 国产男女视频 | 日本在线视频观看 | 亚洲国产精品成人无久久精品 | 波多野结衣在线观看视频 | 亚洲字幕成人中文在线观看 | 超碰在线公开免费 | 狠狠v欧美v日韩v亚洲ⅴ | 日韩精品一区二区三 | 高清视频一区二区三区 | 97se亚洲国产综合在线 | 日批在线视频 | 欧美成人午夜精品久久久 | 韩国美女一区 | 日韩av一级片 | 午夜精品久久久久久久久久久久久 | 日韩aⅴ片 | 日韩激情 | www.国产黄色 | 日韩一级完整毛片 | 国产第一页在线播放 | 一本色道久久综合狠狠躁 | 一本黄色片 | 91黄在线观看 | 黄页视频在线观看 | 91精品久久久久久粉嫩 | 毛茸茸成熟亚洲人 | 亚洲一级av毛片 | 日日躁夜夜躁 | 一级欧美一级日韩片 | 在线观看视频中文字幕 | 国产一区二区视频免费 | 色婷网| 国产亚洲精品码 | 蜜臀久久99精品久久久画质超高清 | 经典三级在线视频 | 亚洲毛片一区 | 一区二区三区四区高清视频 | 福利小视频在线观看 | 日韩电影三级 | 亚洲av无码乱码在线观看性色 |