當前位置:
首頁 >
hbase和es在搜索场景的应用
發布時間:2024/3/13
97
豆豆
生活随笔
收集整理的這篇文章主要介紹了
hbase和es在搜索场景的应用
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
背景
? ? 最近有個簡單的需求,離線數據挖掘得出的標簽需要支持online的查詢,查詢場景比較簡單,支持按照單個id或者多個id批量查詢,tp99需要在200ms,批量的時候id 集合的大小不會超過1000,平均下來不會超過200的樣子。這種場景直接上ES相對來說比較省事,不過ES占用資源較多,想嘗試用hbase來解決這種場景,下面記錄下具體的過程。
? ? ?為何要考慮HBase?
為何要用hbase呢?離線數據是存放在hive表里面的,雖然hbase導入hbase和es都挺方便的,不過據我們測試的情況看,hive2hbase采用bulkload 的方式會快些,而且比較簡單。導入es的過程中步驟繁瑣,需要設置刷新時間和副本數,設置段合并和別名之類的操作,相對來說麻煩許多。hbase按照 rowkey查詢的性能還行,單次查詢在10+ms左右,雖然支持索引,不過性能差強人意,暫時不準備利用其自身的索引。 只利用hbase來存儲元信息,這些信息相對來說比較占空間,僅支持按照 rowkey來查找。? ? ?HBase的若干問題
? ? 丟不掉的ES
在對hbase進行測試之后,id超過200之后,hbase性能直線下降,很難符合線上的要求了,只能再轉回ES了。事實上,在使用hbase之前,我們設想是通過es+hbase或者es+tair來進行對比,這兩種場景因為對索引和數據進行了拆分,性能很難和直接利用es進行查詢相比,最后轉了個圈,還是回到ES上面了,索引信息存儲在es里面,由于es存儲的信息極其簡單,2.5億的記錄索引,經過優化存儲,只占用了9G的空間,200個id查詢的 rt 也就30ms左右,性能還是比較穩定的。ES的優點如下:? ? ES的問題
總結
以上是生活随笔為你收集整理的hbase和es在搜索场景的应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 大学这么多比赛,我该参加哪个?
- 下一篇: 裁剪图像的黑边(图像拼接后的黑边去除)