日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ORCFILE,ParquetFile,CubeFile使用场景区别

發布時間:2025/4/5 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ORCFILE,ParquetFile,CubeFile使用场景区别 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

這個其實是轉自杭州第三次spark meetingup,華為的李昆大神的分享。

OLAP分析場景ORC?FileParquet?FileCube?File
Full?scan?one?dimensionFast?FastMedian
(Low?Cardinality)(只掃需要的列)(只掃需要的列)(只掃需要的列,但MDK較大)
Full?scan?one?dimensionSlowSlowFast
(High?Cardinality)(Stripe?Level字典編碼,需要重復解碼)(Row?Group?Level字典編碼,需要重復解碼)(全局字典編碼,無重復解碼)
Full?scan?multiple?dimension?aggregationSlowSlowFast
(讀取多行并做join)(讀取多行并做join)(星型模型轉換后無需join)
Filter?single?dimensionSlowVery?SlowFast
(需要全掃描單列,可利用min/max跳過Stripe)(需要全掃描單列,無索引)(利用多維索引)
Filter?multiple?dimensionsSlowVery?SlowVery?Fast
Select?Year,ServiceName,?(需要全掃描多列,可利用min/max跳過Stripe)(需要全掃描多列,無索引)(利用多維索引)
Filter?on?MeasureSlowSlowSlow
(需要全掃描,可利用min/max跳過Stripe)(需要全掃描,無索引)(度量上無索引,需要全掃描)

?

排版有些亂,大家湊合看一下。

從這個比較來看,大基數的全量多維的查詢,CubeFile的優勢是很明顯的。

個人感覺,最大原因是ORCFile和ParquetFile他們是分塊索引數據的,而CubeFile是全量索引數據的。現在理解的還比較淺,等深入理解后再來論這個的區別和關系。

總結

以上是生活随笔為你收集整理的ORCFILE,ParquetFile,CubeFile使用场景区别的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。