ElasticSearch 2 (27) - 信息聚合系列之故事开始
ElasticSearch 2 (27) - 信息聚合系列之故事開始
摘要
到目前為止,本書都在著重介紹搜索。對于搜索,我們有查詢條件以及與查找到與條件匹配的集合。這個過程就和如大海撈針一樣。
對于聚合,我們站在遠處總觀數據。與查看單個文檔不同,我們想要對數據集合進行整體的分析和總結。
版本
elasticsearch版本: elasticsearch-2.x
內容
到目前為止,本書都在著重介紹搜索。對于搜索,我們有查詢條件以及與查找到與條件匹配的集合。這個過程就和如大海撈針一樣。
對于聚合,我們站在遠處總觀數據。與查看單個文檔不同,我們想要對數據集合進行整體的分析和總結:
- 大海里有多少針?
- 針的平均長度是多少?
- 所有長度的中位數是什么?按生產商分類結果會是怎樣?
- 每個月大海里面會掉進多少根針?
聚合還可以回答更為詳細的問題:
- 銷量最好的針的生產商是哪個?
- 存在不普通或異常的針嗎?
聚合允許我們問一些更復雜的數據問題。盡管和搜索的功能完全不同,但它利用相同的數據結構,這使聚合能夠快速運行 近乎實時,就像搜索一樣。
這對報表和儀表盤是強大的支持,不須要對所有數據進行匯總(不太好用的 Hadoop任務要執行一個星期),我們可以實時看到數據,并做出快速響應。報表隨著數據的變化而變化,而不是那些預先計算好卻已經過時的無關信息。
最后,聚合操作是與查詢請求并行執行的,這意味著對于相同數據、同一請求,我們可以搜索、過濾文檔,同時又能完成分析工作。由于聚合是在用戶搜索的背景下計算的,我們不僅僅是顯示四星級酒店,而是顯示與搜索條件相匹配的四星級酒店。
聚合的功能非常強大以至于很多公司建立龐大的 Elasticsearch 集群的目的只是為了分析。
參考
elastic.co: Aggregations
轉載于:https://www.cnblogs.com/richaaaard/p/5311548.html
總結
以上是生活随笔為你收集整理的ElasticSearch 2 (27) - 信息聚合系列之故事开始的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: javascript :得到上星期的这一
- 下一篇: 海思烧写工具需要java_HiTool(