當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Hive 分区表

發(fā)布時間：2024/9/16 编程问答 45 豆豆

生活随笔收集整理的這篇文章主要介紹了 Hive 分区表小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

在hive中創(chuàng)建一個表：

create external table track_info( ip string, country string, province string, city string, url string, time string, page string ) partitioned by (day string) row format delimited fields terminated by '\t' location '/project/trackinfo/';

從HDFS中導入數(shù)據(jù)：load data inpath 'hdfs://swarm-worker1:9000/project/input/etl' overwrite into table track_info partition(day='2013-07-21');
因為我們使用分區(qū)，所以需要指定partition(day='2013-07-21')。

然后查看HDFS中的數(shù)據(jù)：

發(fā)現(xiàn)會自動根據(jù)我們的分區(qū)字段作為我們的目錄，進入到目錄day=2013-07-21：

執(zhí)行查詢時，可以指定分區(qū)：
select count(1) from track_info where day='2013-07-21';這就會生成一個mapreduce運行。

總結(jié)

以上是生活随笔為你收集整理的Hive 分区表的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Hive 内部表与外部表
下一篇： Hive将查询结果保存到另一张表中