日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Spark Relational Cache实现亚秒级响应的交互式分析

發布時間:2024/8/23 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Spark Relational Cache实现亚秒级响应的交互式分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本次分享主要分為以下四個方面:

  • 項目介紹
  • 技術分析
  • 如何使用
  • 性能分析
  • 一、項目介紹

    項目背景

    阿里云EMR是一個開源大數據解決方案,目前EMR上面已經集成了很多開源組件,并且組件數量也在不斷的增加中。EMR下層可以訪問各種各樣的存儲,比如對象存儲OSS、集群內部自建的HDFS以及流式數據等。用戶可以利用EMR處理海量數據和進行快速分析,也能夠支持用戶在上面做機器學習以及數據清洗等工作。EMR希望能夠支撐非常大的業務數據量,同時也希望能夠在數據量不斷增長的時候,能夠通過集群擴容實現快速數據分析。

    云上Adhoc數據分析痛點

    在云上做Adhoc數據分析的時候,很難實現隨著數據量的增長使得查詢的延遲不會大幅度增加。雖然目前各種引擎不斷出現,并且某些引擎在一些場景下運行很快,但是數據量變大之后,查詢響應速度難免有所下降,因此希望在比較統一的平臺之上獲得較好的性能。與此同時,阿里云也希望能夠提供云原生的解決方案。Spark是目前工業界使用較多的計算引擎,應用非常廣泛,但是在處理Adhoc上還是存在很多不足之處,因此阿里云在Spark上做了大量優化,幫助用戶滿足Adhoc查詢的需求。因此就會涉及到緩存方案,雖然Spark中很早就有了緩存機制,但想要滿足云上Adhoc場景卻存在很多不足之處,因此阿里云會在Spark上做大量優化,幫助用戶優化Adhoc查詢速度。但是如果把數據放到內存中,將所有數據全部用作緩存可能也不足夠,因此就催生出了Spark Relational Cache。

    Spark Relational Cache

    用戶的SQL請求過來之后,到了Spark上面,會需要比較長的時間在數據來源上進行處理,這里下層的存儲包括集群的HDFS以及遠端的JindoFS和阿里云OSS等。當有了Spark Relational Cache之后,查詢過來之后會查詢是否能夠用到存儲在Relational Cache中緩存的數據,如果不能用到則會轉發到原生路徑上,如果能用到則會用非常快的速度從緩存里面將數據讀取出來并將結果返回給用戶。因為Relational Cache構建在高效存儲之上,通過用戶的DDL將數據變成Relational Cache。

    Spark Relational Cache特點

    Spark Relational Cache希望能夠達到秒級響應或者亞秒級響應,能夠在提交SQL之后很快地看到結果。并且也支持很大的數據量,將其存儲在持久化的存儲上面,同時通過一些匹配手段,增加了匹配的場景。此外,下層存儲也使用了高效的存儲格式,比如離線分析都會使用的列式存儲,并且對于列式存儲進行了大量優化。此外,Relational Cache也是用戶透明的特性,用戶上來進行查詢不需要知道幾個表之間的關系,這些都是已經有過緩存的,不需要根據已有的緩存重寫Query,可以直接判斷是否有可以使用的Relational Cache,對于一個廠商而言只需要幾個管理員進行維護即可。Spark Relational Cache支持自動更新,用戶不需要擔心因為插入了新的數據就使得Cache過時導致查詢到錯誤的數據,這里面為用戶提供了一些設置的規則,幫助用戶去進行更新。此外,Spark Relational Cache還在研發方面,比如智能推薦方面進行了大量探索,比如根據用戶SQL的歷史可以推薦用戶基于怎樣的關系去建立Relational Cache。

    二、技術分析

    阿里云EMR具有很多核心技術,如數據預計算、查詢自動匹配以及數據預組織。

    數據預計算

    數據在很多情況下都有一個模型,雪花模型是傳統數據庫中非常常見的模型,阿里云EMR添加了Primary Key/Foreign Key的支持,允許用戶通過Primary Key/Foreign Key明確表之間的關系,提高匹配成功率。在數據預計算方面,充分利用EMR Spark加強的計算能力。此外,還通過Data Cube數據立方來支持多維數據分析。

    執行計劃重寫

    這部分首先通過數據預計算生成預計算的結果,并將結果存儲在外部存儲上,比如OSS、HDFS以及其他第三方存儲中,對于Spark DataSource等數據格式都支持,對于DataLake等熱門的存儲格式后續也會添加支持。在傳統數據庫中有類似的優化方案,比如物化視圖方式,而在Spark中使用這樣的方式就不合適了,將邏輯匹配放在了Catalyst邏輯優化器內部來重寫邏輯執行計劃,判斷Query能否通過Relational Cache實現查詢,并基于Relational Cache實現進一步的Join或者組合。將簡化后的邏輯計劃轉化成為物理計劃在物理引擎上執行。依托EMR Spark其他的優化方向可以實現非常快速的執行結果,并且通過開關控制執行計劃的重寫。

    自動查詢匹配

    這里有一個簡單的例子,將三個表簡單地Join在一起,經過過濾條件獲得最終的結果。當Query過來之后先判斷Spark Relational Cache是否能夠符合需求,進而實現對于預先計算好的結果進行過濾,進而得到最終想要的結果。

    數據預組織

    如果將數十T的數據存在存儲里面,那么從這個關系中獲取最終的結果還需要不少的時間,因為需要啟動不少的Task節點,而這些Task的調度也需要不少的開銷,通過文件索引的方式將時間開銷壓縮到秒級水平,可以在執行時過濾所需要讀取的文件總量,這樣大大減少了任務的數量,這樣執行的速度就會快很多。因為需要讓全局索引變得更加有效,因此最好讓數據是排過序的,如果對于結構化數據進行排序就會知道只是對于排列在第一位的Key有一個非常好的優化效果,對于排列在后面的Key比較困難,因此引入了ZOrder排序,使得列舉出來的每個列都具有同等的效果。同時將數據存儲在分區表里,使用GroupID作為分區列。

    三、如何使用

    DDL

    對于簡單的Query,可以指定自動更新的開關,并起一個名字方便后續管理。還可以規定數據Layout的形式,并最終通過SQL語句來描述關系,后續提供給用戶WebUI一樣的東西,方便用戶管理Relational Cache。

    數據更新

    Relational Cache的數據更新主要有兩種策略,一種是On Commit,比如當依賴的數據發生更新的時候,可以將所有需要添加的數據都追加寫進去。還有一種默認的On Demand形式,用戶通過Refresh命令手動觸發更新,可以在創建的時候指定,也可以在創建之后手工調整。Relational Cache增量的更新是基于分區實現的,后續會考慮集成一些更加智能的存儲格式,來支持行級別的更新。

    四、性能分析

    Cube構建

    阿里巴巴的EMR Spark對于1T數據的構建時間只需要1小時。

    查詢性能

    在查詢性能方面,SSB平均查詢耗時,無Cache時查詢 時間按Scale成比例增加,Cache Cube后始終保持在亞秒級響應。


    阿里云雙11領億元補貼,拼手氣抽iPhone 11 Pro、衛衣等好禮,點此參與:http://t.cn/Ai1hLLJT

    原文鏈接
    本文為云棲社區原創內容,未經允許不得轉載。

    總結

    以上是生活随笔為你收集整理的Spark Relational Cache实现亚秒级响应的交互式分析的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: www.黄色大片| 日韩天堂av | 老湿机69福利区午夜x片 | 久久久蜜桃一区二区 | 能免费看黄色的网站 | 亚洲男人在线天堂 | 欧美日韩免费一区 | 日日摸日日添日日躁av | 玖玖在线免费视频 | 成人av第一页 | 亚洲综合色av | 农村少妇久久久久久久 | 日韩成人午夜 | 四虎在线精品 | 好看的av网址 | 日韩精品一区三区 | 国产男女啪啪 | 蜜臀久久99精品久久久画质超高清 | 寡妇av | 男女做爰猛烈吃奶啪啪喷水网站 | 男人的天堂在线视频 | 日本高清久久 | 成人精品福利视频 | 中文字幕欧美日韩 | 六月综合 | 久久精品国产视频 | 四虎永久在线精品免费一区二区 | 天天综合网久久 | 欧美a视频 | 免费视频www在线观看网站 | 午夜h视频| 国产性猛交普通话对白 | 91性生活| 欧美特黄一区二区三区 | 亚欧成人在线 | 用力抵着尿进去了h | 人民的名义第二部 | 久久久久久久综合色一本 | 黄色成人在线 | 综合激情婷婷 | 免费观看nba乐趣影院 | 美女扒开内裤让男人捅 | 人妻少妇久久中文字幕 | 高清欧美性猛交xxxx黑人猛交 | 黄色一集片 | 亚洲精品偷拍 | 久久精品视频5 | 五月婷婷丁香久久 | 国产精品亚洲精品 | 国产精品福利在线观看 | 国产精品毛片视频 | 色久婷婷 | 色哟哟精品一区 | 黄色av网站免费观看 | 中国a一片一级一片 | 农村黄色片 | 精品视频一二区 | 中国a级黄色片 | 极品美女啪啪 | 波多野一区二区 | 国产综合久久 | 亚洲色图狠狠干 | 免费看国产黄色片 | 国产香蕉av| 日韩中文字幕在线播放 | 97香蕉视频| 美女二区 | 男女操操| 日韩精品视 | 日韩视频免费在线播放 | 国产三级久久久久 | 亚洲视频456 | 天天操天天操天天 | 国产男女猛烈无遮挡免费视频 | 亚洲精品一区二区三区婷婷月 | 娇妻之欲海泛舟无弹窗笔趣阁 | 国产深喉视频一区二区 | 亚洲国内在线 | 久久精品人人做人人爽 | 在线观看一区 | 污污视频在线观看免费 | 天天爽夜夜操 | 最近中文字幕在线中文视频 | 在线色网 | 夜夜嗨老熟女av一区二区三区 | 九九热8| 麻豆视频入口 | 中文字幕人妻一区二区三区在线视频 | 亚洲av无码一区二区乱子伦 | 极品尤物一区二区 | 台湾黄色网址 | 亚洲一区二区三区精品视频 | 在线观看视频你懂得 | 91插插插插插 | 色婷婷在线视频 | 成人综合激情 | 人人妻人人澡人人爽人人欧美一区 | 91在线观看 | 秋霞视频在线 |