学习笔记Hive(四) —— Hive应用(2)—— Hive导入及导出数据
生活随笔
收集整理的這篇文章主要介紹了
学习笔记Hive(四) —— Hive应用(2)—— Hive导入及导出数据
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
四、Hive導入及導出數據
- 通過HDFS直接導入導出
- 通過Hive命令導入導出
4.1、Hive導入數據的語法
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] LOCAL:導入語句帶有LOCAL,說明是導入Linux本地的數據,若是從HDFS上導入數據,則導入語句不加LOCAL; filepath:數據的路徑 OVERWRITE:指定覆蓋表之前的數據,如果是追加,則去掉OVERWRITE關鍵字即可。 PARTITON:如果是分區表,指定分區字段的名稱。任務實現:導入數據到泰坦尼克乘客表中
下面先把train.csv導入到hdfs的/user/root目錄下,然后就可以直接把hdfs上的導入到數據庫
4.2、單表查詢導入數據
INSERT [OVERWRITE|INTO] table 表1 [PARTITION(part1=val1,part2=val2)] SELECT字段1, 字段2, 字段3 FROM 表2 ; OVERWRITE:覆蓋 INTO:追加 PARTITION:分區表 填分區字段4.3、多表查詢導入數據
FROM 表1 INSERT INTO TABLE 表2 SELECT 字段 LIMIT N INSERT INTO TABLE 表3 SELECT 字段 WHERE … ;任務實現:
查詢tidanic表中的存活乘客數據到tidanic_save
查詢tidanic表中的死亡乘客數據到tidanic_died
4.4、導出到Linux本地
INSERT OVERWRITE [LOCAL] DIRECTORY '路徑’ ROW FORMAT DELIMITED FIELDS TERMINATED BY ',’ SELECT 字段1, 字段2, 字段3 FROM 表名 ; 如果添加LOCAL關鍵字,那么導出的是本地目錄,如果沒有該關鍵字,那么導出的是HDFS目錄; ROW FORMAT DELIMITED FIELDS TERMINATED BY ','在這里指定導出數據的分隔符為‘,’。 OVERWRITE LOCAL DIRECTORY 查詢結果將覆蓋本地目錄任務實現:導出死亡名單到Linux本地
查看
總結
以上是生活随笔為你收集整理的学习笔记Hive(四) —— Hive应用(2)—— Hive导入及导出数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 学习笔记Hive(三) —— Hive应
- 下一篇: 学习笔记Hive(五) —— Hive应