ClickHouse SAMPLE 采样子句介绍
該 SAMPLE 子句允許近似于 SELECT 查詢處理。
啟用數(shù)據(jù)采樣時,不會對所有數(shù)據(jù)執(zhí)行查詢,而只對特定部分數(shù)據(jù)(樣本)執(zhí)行查詢。 例如,如果您需要計算所有訪問的統(tǒng)計信息,只需對所有訪問的1/10分數(shù)執(zhí)行查詢,然后將結果乘以10即可。
近似查詢處理在以下情況下可能很有用:
- 當你有嚴格的時間需求(如<100ms),但你不能通過額外的硬件資源來滿足他們的成本。
- 當您的原始數(shù)據(jù)不準確時,所以近似不會明顯降低質量。
- 業(yè)務需求的目標是近似結果(為了成本效益,或者向高級用戶推銷確切結果)。
下面列出了數(shù)據(jù)采樣的功能:
1.數(shù)據(jù)采樣是一種確定性機制。 同樣的結果 SELECT .. SAMPLE 查詢始終是相同的。
2.對于不同的表,采樣工作始終如一。 對于具有單個采樣鍵的表,具有相同系數(shù)的采樣總是選擇相同的可能數(shù)據(jù)子集。 例如,用戶Id的示例采用來自不同表的所有可能的用戶Id的相同子集的行。 這意味著您可以在子查詢中使用采樣 [IN] 此外,您可以使用 [JOIN] 。
3.采樣允許從磁盤讀取更少的數(shù)據(jù)。 請注意,您必須正確指定采樣鍵。 有關詳細信息,請參閱 [創(chuàng)建MergeTree表].
4.為 SAMPLE 子句支持以下語法:
SAMPLE K
這里 k 從0到1的數(shù)字(支持小數(shù)和小數(shù)表示法)。 例如, SAMPLE 1/2 或 SAMPLE 0.5.
在一個 SAMPLE k 子句,
總結
以上是生活随笔為你收集整理的ClickHouse SAMPLE 采样子句介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: rj45 千兆接口定义_rj45接口定义
- 下一篇: 详解物理层_计算机网络