kylin分析引擎:运行原理、维度和Cube等名词解释、核心算法
生活随笔
收集整理的這篇文章主要介紹了
kylin分析引擎:运行原理、维度和Cube等名词解释、核心算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
架構
kylin是一款分析引擎,最常用的數據源是Hive。1.5版本之后數據源增加了kafka,但最常用的仍然是Hive。但是Hive查詢比較慢,Kylin解決了這一問題。
大致流程:
第一步:從Hive或Kafka中獲取數據;
第二步:有Cube構建引擎對數據進行加工;
第三步:將加工后的數據存儲到HBase;(Kylin快的根本所在)
第四步:暴露接口供外部查詢。
以下這個組件負責數據的查詢,億級數據亞秒級別查詢就靠它了:
以下兩個組件用于解決離線數據的存儲:
Kylin從Hive中獲取到數據,然后由下面這個組件進行加工:將所有維度可能的組合給提前預計算好之后存儲到HBase,查詢九直接走HBase。這個預計算的過程就是MR來完成的,1.6之后可以選擇spark作為計算引擎。
名詞解釋
維度和度量
比如:性別、年齡是維度,人數就是度量(也叫指標等)
Cube和Cuboid
核心算法
逐層構建算法
快速構建算法
總結
以上是生活随笔為你收集整理的kylin分析引擎:运行原理、维度和Cube等名词解释、核心算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: docker --link容器互联
- 下一篇: kylin的安装和启动