hive的新分区和旧分区的概念问题
生活随笔
收集整理的這篇文章主要介紹了
hive的新分区和旧分区的概念问题
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
hive中的一個表格中的內容可以存儲在不同分區(可以理解為分片).
?
[1]中描述的是,試圖給表格新增一個字段,結果只給新分區進行了新增字段操作,老分區并沒有影響,
需要使用如下的cascade寫法
alter table tb add columns(col1 string) cascade;
?
[2]中試圖查詢最新的分區,但是又不希望遍歷所有的分區來尋找,效率太低.
?
總結:
對于hive的操作,要時刻注意新分區和舊分區的問題.
否則會導致數據不完整以及性能低下的問題
?
?
Reference:
[1][Hive]新增字段(column)后,舊分區無法更新數據問題
[2]如何在HIVE表中找到最新的分區(How to find the most recent partition in HIVE table)
總結
以上是生活随笔為你收集整理的hive的新分区和旧分区的概念问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于心情的唯美短句说说大全128个
- 下一篇: flink-faker用法示例(还没弄完