学习笔记Hive(四) —— Hive应用(2)—— Hive导入及导出数据
生活随笔
收集整理的這篇文章主要介紹了
学习笔记Hive(四) —— Hive应用(2)—— Hive导入及导出数据
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
四、Hive導(dǎo)入及導(dǎo)出數(shù)據(jù)
- 通過HDFS直接導(dǎo)入導(dǎo)出
- 通過Hive命令導(dǎo)入導(dǎo)出
4.1、Hive導(dǎo)入數(shù)據(jù)的語法
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] LOCAL:導(dǎo)入語句帶有LOCAL,說明是導(dǎo)入Linux本地的數(shù)據(jù),若是從HDFS上導(dǎo)入數(shù)據(jù),則導(dǎo)入語句不加LOCAL; filepath:數(shù)據(jù)的路徑 OVERWRITE:指定覆蓋表之前的數(shù)據(jù),如果是追加,則去掉OVERWRITE關(guān)鍵字即可。 PARTITON:如果是分區(qū)表,指定分區(qū)字段的名稱。任務(wù)實現(xiàn):導(dǎo)入數(shù)據(jù)到泰坦尼克乘客表中
下面先把train.csv導(dǎo)入到hdfs的/user/root目錄下,然后就可以直接把hdfs上的導(dǎo)入到數(shù)據(jù)庫
4.2、單表查詢導(dǎo)入數(shù)據(jù)
INSERT [OVERWRITE|INTO] table 表1 [PARTITION(part1=val1,part2=val2)] SELECT字段1, 字段2, 字段3 FROM 表2 ; OVERWRITE:覆蓋 INTO:追加 PARTITION:分區(qū)表 填分區(qū)字段4.3、多表查詢導(dǎo)入數(shù)據(jù)
FROM 表1 INSERT INTO TABLE 表2 SELECT 字段 LIMIT N INSERT INTO TABLE 表3 SELECT 字段 WHERE … ;任務(wù)實現(xiàn):
查詢tidanic表中的存活乘客數(shù)據(jù)到tidanic_save
查詢tidanic表中的死亡乘客數(shù)據(jù)到tidanic_died
4.4、導(dǎo)出到Linux本地
INSERT OVERWRITE [LOCAL] DIRECTORY '路徑’ ROW FORMAT DELIMITED FIELDS TERMINATED BY ',’ SELECT 字段1, 字段2, 字段3 FROM 表名 ; 如果添加LOCAL關(guān)鍵字,那么導(dǎo)出的是本地目錄,如果沒有該關(guān)鍵字,那么導(dǎo)出的是HDFS目錄; ROW FORMAT DELIMITED FIELDS TERMINATED BY ','在這里指定導(dǎo)出數(shù)據(jù)的分隔符為‘,’。 OVERWRITE LOCAL DIRECTORY 查詢結(jié)果將覆蓋本地目錄任務(wù)實現(xiàn):導(dǎo)出死亡名單到Linux本地
查看
總結(jié)
以上是生活随笔為你收集整理的学习笔记Hive(四) —— Hive应用(2)—— Hive导入及导出数据的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 学习笔记Hive(三) —— Hive应
- 下一篇: 学习笔记Hive(五) —— Hive应