日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

hive分区用2个字段有何限制_Hive分区表和桶表的使用

發布時間:2023/12/2 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 hive分区用2个字段有何限制_Hive分区表和桶表的使用 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我們看官網文檔中這個地方

我們先創建好數據庫,以供練習

使用數據庫

我們創建數據表

我們創建分區表,選取的字段不能是表中存在的字段

元數據信息

Formatted信息

那我們加載信息

load data local inpath '/data/hivetest/dept.txt' into table dept_partition partition(bmbh=1);

我們查看數據

我們看下HDFS上,是目錄的形式

所以我們可以多加載幾份數據

查看數據和HDFS上

也可以創建二級分區

載入數據

查看下數據

查看下元數據

再看下HDFS

我們就可以依據條件查詢使用where語句

注:分區表可以提高查詢的效率。

我們再看這個地方-桶表

這個和分區表不一樣的地方,選取字段必須是表里的字段

我們準備個員工表

我們創建下桶表

我們加載下數據

看下HDFS

實際在桶表中,我們應該使用另外一種語句

運行過程

出現了點問題

三個節點時間不同步,設定下時間

date -s "2019-12-5 17:50:00"

再執行就可以了

查看結果

我們看HDFS上

我們查看下文件,已經分開了,如果有問題看看你的hive版本是否有這個屬性沒有打開。hive.enforce.bucketing。

注:其中桶表查詢還有下面的語句,可以仔細研究下,暫時先放一放,后續學習深入再了解。

Select * from table tablesample(bucket 1 out of 2)

Tablesample是抽樣數據,語法tablesample(bucket x out of y)y必須是table總bucket數的倍數或者因子。Hive根據y的大小,決定抽樣比例。例如:table總共分為64份,當y=32時,抽取(64/32)2個bucket數據;當y=128時,抽取(64/128)1/2個bucket數據,x表示從哪個bucket開始抽取,例如table總bucket數為32,tablesample(3 out of 16),表示總共抽取(32/16)2個bucket數據,分別為第3個bucket和第(3+16)19個bucket數據。

總結

以上是生活随笔為你收集整理的hive分区用2个字段有何限制_Hive分区表和桶表的使用的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。