hive实例,GPRS流量统计
生活随笔
收集整理的這篇文章主要介紹了
hive实例,GPRS流量统计
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
2019獨(dú)角獸企業(yè)重金招聘Python工程師標(biāo)準(zhǔn)>>>
最近面試,發(fā)現(xiàn)很多公司在使用hive對(duì)數(shù)據(jù)進(jìn)行處理。hive是hadoop家族成員,是一種解析like sql語(yǔ)句的框架。它封裝了常用MapReduce任務(wù),讓你像執(zhí)行sql一樣操作存儲(chǔ)在HDFS的表。
hive的表分為兩種,內(nèi)表和外表。
Hive 創(chuàng)建內(nèi)部表時(shí),會(huì)將數(shù)據(jù)移動(dòng)到數(shù)據(jù)倉(cāng)庫(kù)指向的路徑;若創(chuàng)建外部表,僅記錄數(shù)據(jù)所在的路徑,不對(duì)數(shù)據(jù)的位置做任何改變。
在刪除表的時(shí)候,內(nèi)部表的元數(shù)據(jù)和數(shù)據(jù)會(huì)被一起刪除, 而外部表只刪除元數(shù)據(jù),不刪除數(shù)據(jù)。這樣外部表相對(duì)來(lái)說(shuō)更加安全些,數(shù)據(jù)組織也更加靈活,方便共享源數(shù)據(jù)。
Hive的內(nèi)外表,還有一個(gè)Partition的分區(qū)的知識(shí)點(diǎn),用于避免全表掃描,快速檢索。后期的文章會(huì)提到。
http://www.maoxiangyi.cn/index.php/archives/294
轉(zhuǎn)載于:https://my.oschina.net/u/725837/blog/152867
總結(jié)
以上是生活随笔為你收集整理的hive实例,GPRS流量统计的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Android ANR
- 下一篇: 孕妇做梦梦到活人死了是什么意思