Phoenix:全局索引设计实践
概述
全局索引是Phoenix的重要特性,合理的使用二級(jí)索引能降低查詢延時(shí),讓集群資源得以充分利用。 本文將講述如何高效的設(shè)計(jì)和使用索引。
全局索引說(shuō)明
全局索引的根本是通過(guò)單獨(dú)的HBase表來(lái)存儲(chǔ)數(shù)據(jù)表的索引數(shù)據(jù)。我們通過(guò)如下示例看索引數(shù)據(jù)和主表數(shù)據(jù)的關(guān)系。
當(dāng)寫入數(shù)據(jù)到主表時(shí),索引數(shù)據(jù)也會(huì)被同步到索引表中。索引表中的主鍵將會(huì)是索引列和數(shù)據(jù)表主鍵的組合值,include的列被存儲(chǔ)在索引表的普通列中,其目的是讓查詢更加高效,只需要查詢一次索引表就能夠拿到數(shù)據(jù),而不用去回查主表。其過(guò)程入下圖:
Phoenix表就是HBase表,而HBase Rowkey都是通過(guò)二進(jìn)制數(shù)據(jù)的字典序排列存儲(chǔ),也就意味著Row key前綴匹配度越高就越容易排在一起。
全局索引設(shè)計(jì)
我們繼續(xù)使用DATA_TABLE作為示例表,創(chuàng)建如下組合索引。之前我們已經(jīng)提到索引表中的Row key是字典序存儲(chǔ)的,什么樣的查詢適合這樣的索引結(jié)構(gòu)呢?
CREATE INDEX B_C_D_IDX ON DATA_TABLE(B,C,D);
所有字段條件以=操作符為例:
注:上表查詢中and條件不一定要和索引組合字段順序一致,可以任意組合。
在實(shí)際使用中我們也只推薦使用1~4,遵循前綴匹配原則,避免觸發(fā)掃全表。5~7條件就要掃描全表數(shù)據(jù)才能過(guò)濾出來(lái)符合這些條件的數(shù)據(jù),所以是極力不推薦的。
其它
? 對(duì)于order by字段或者group by字段仍然能夠使用二級(jí)索引字段來(lái)加速查詢。
? 盡量通過(guò)合理的設(shè)計(jì)數(shù)據(jù)表的主鍵規(guī)避建更多的索引表,因?yàn)樗饕碓蕉鄬懛糯笤絿?yán)重。
? 使用了ROW_TIMESTAMP特性后不能使用全局索引
? 對(duì)索引表適當(dāng)是的使用加鹽特性能提升查詢寫入性能,避免熱點(diǎn)。
本文作者:瑾謙
閱讀原文
本文為云棲社區(qū)原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的Phoenix:全局索引设计实践的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 最常用的15个前端表单验证JS正则表达式
- 下一篇: 「javaScript-每三位插入一个逗