日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Amazon Redshift 架构

發布時間:2025/4/16 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Amazon Redshift 架构 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Amazon Redshift 的混合架構可提供無與倫比的性能

共享存儲功能支持無限并發擴展,同時 Redshift 的實例存儲功能支持低延遲訪問無法通過其他方式訪問的數據。? 這兩個策略的獨特組合使得 Redshift 目前具備一流的性能,并能在日后不斷改進。

領導節點通過機器學習和結果緩存路由查詢并加快查詢速度 計算擴展至處理高并發和數據湖查詢 存儲擴展至 Amazon S3 數據湖中的數 EB 數據(多種開放格式,包括 Parquet 和 ORC)? ? ? ? ? ?

?

Amazon Redshift 將數據倉庫查詢擴展到您的數據湖,無需加載。您可以針對 Redshift 中本地存儲的 PB 級數據運行分析查詢,以及直接針對 Amazon S3 中存儲的 EB 級數據運行分析查詢。設置和自動執行大多數管理任務以及在任意規模中提供快速性能都非常簡單。

Amazon S3 數據湖:Amazon Redshift 是將您的查詢擴展到 Amazon S3 數據湖而無需加載數據的唯一數據倉庫。您可以直接在 S3 中查詢已使用的開放文件格式,例如 Avro、CSV、Grok、JSON、ORC 和 Parquet 等。

AWS 分析生態系統:Amazon Redshift 與 AWS 分析生態系統進行原生集成。AWS Glue 可以將數據提取、轉換和加載 (ETL) 到 Redshift 中。Amazon Kinesis Data Firehose 是捕獲、轉換流數據并將其加載到 Redshift 以實現近乎實時分析的一種簡單方式。您可以使用 Amazon QuickSight 創建報告、可視化和控制面板。?為了加速向 Amazon Redshift 的遷移,您可以免費使用 AWS Database Migration Service (DMS) 六個月。

Redshift Spectrum 是 Amazon Redshift 的一項功能,借助這項功能,您可以對 Amazon S3 中 EB 級非結構化數據運行查詢,而無需進行加載或 ETL 操作。當您發布查詢時,查詢會進入 Amazon Redshift SQL 終端節點,該終端節點會生成查詢方案并對其進行優化。Amazon Redshift 會確定哪些數據存儲在本地以及哪些數據存儲在 Amazon S3 中,然后生成一種方案來盡可能減少需要讀取的 Amazon S3 數據量,從共享資源池中請求 Redshift Spectrum 工作線程來讀取和處理 Amazon S3 中的數據。

?

Amazon Redshift 使用各種創新技術,與傳統的數據倉庫存儲及分析用數據庫相比,其性能提高將近十倍:

  • 列式數據存儲:Amazon Redshift 以列組織數據,并非以一系列的行來存儲數據。與適用于事務處理的基于行的系統不同,基于列的系統適用于數據倉庫存儲及分析,在此系統中,查詢經常涉及到對大型數據集進行聚合。由于僅對涉及查詢的列進行處理,且列式數據按順序存儲在存儲介質上,故基于列的系統所需的 I/O 要少得多,從而顯著提高了查詢性能。
  • 高級壓縮:與基于行的數據存儲相比,列式數據存儲可進行更大程度的壓縮,因為類似的數據是按順序存儲在硬盤上。Amazon Redshift 擁有多種壓縮技術,與傳統的關系數據存儲相比,通常可進行較大程度的壓縮。此外,與傳統的關系數據庫系統相比,Amazon Redshift 不需要索引或具體化視圖,因此使用的空間較少。將數據加載到空表中時,Amazon Redshift 會自動對您的數據進行采樣并選擇最合適的壓縮方案。
  • 大規模并行處理 (MPP):Amazon Redshift 可以自動將數據與查詢負載分配到所有節點。借助 Amazon Redshift,您可以輕松將節點添加至數據倉庫,而且隨著您的數據倉庫規模的擴大,仍能維持快速的查詢性能。
  • Redshift Spectrum:借助 Redshift Spectrum,您可以對 Amazon S3 中的 EB 級數據運行查詢,且無需進行加載或 ETL 操作。即使沒有在 Amazon Redshift 中存儲任何數據,您仍然可以使用 Redshift Spectrum 查詢 Amazon S3 中的 EB 級數據集。當您發布查詢時,查詢會進入 Amazon Redshift SQL 終端節點,該終端節點會生成查詢方案。Amazon Redshift 會確定哪些數據存儲在本地以及哪些數據存儲在 Amazon S3 中,然后生成一種方案來盡可能減少需要讀取的 Amazon S3 數據量,從共享資源池中請求 Redshift Spectrum 工作線程來讀取和處理 Amazon S3 中的數據,然后將結果返回 Amazon Redshift 群集進行任何剩余處理。

您可以使用 AWS 管理控制臺或 Amazon Redshift API 輕松創建 Amazon Redshift 數據倉庫群集。您可以從單節點 160GB 數據倉庫開始,然后在 AWS 控制臺中單擊幾下或調用一個 API,一路擴展到 1PB 或更大。

單節點配置使您能夠開始經濟快速地使用 Amazon Redshift,而且隨著您的需求的增長,單節點配置可擴展為多節點配置。?一個 Redshift 數據倉庫群集中可以包含 1 到 128 個計算節點,具體取決于節點類型。

  • 多節點配置需要一個領導節點來管理客戶端的連接并接收查詢,以及兩個計算節點來存儲數據并執行查詢和計算。系統將自動為您配置領導節點,并且您無需為其付費。僅需指定您的首選可用區(可選項)、節點數量、節點類型、主機名稱和密碼、安全組、您對備份保留期的首選項及其他系統設置。在您選定理想配置后,Amazon Redshift 將預置所需資源并建立數據倉庫群集。
  • 領導節點接收來自客戶端應用程序的查詢,分析查詢并制定執行計劃,是對查詢進行處理的一套有序步驟。然后領導節點和計算節點協調這些計劃的并行執行,聚合來自這些節點的中間結果,并將這些結果最終返回至客戶端應用程序。
  • 計算節點執行執行計劃所規定的步驟,并在這些計劃之間傳輸數據,從而為這些查詢進行服務。中間結果會先被送回至領導節點進行聚合,然后才會被送回至客戶端應用程序。
    • 密集存儲 (DS) 節點類型提供兩種大小:超大型節點和八倍超大型節點。超大型節點 (XL) 有 3 個硬盤,總共 2TB 的磁盤存儲,而八倍超大型節點 (8XL) 有 24 個硬盤,總共 16TB 的磁盤存儲。DS2.8XLarge 有 36 個 Intel Xeon E5-2676 v3 (Haswell) 虛擬內核和 244GiB RAM,DS2.XL 有 4 個 Intel Xeon E5-2676 v3 (Haswell) 虛擬內核和 31GiB RAM。請參閱定價頁面了解更多詳細信息。您可從每小時 0.85 USD 的單個超大型節點 2TB 數據倉庫開始,然后擴展至 1PB 或更大。您可按小時付費或使用預留實例定價,將價格降低到每年每 TB 不到 1000 USD。
    • 密集計算 (DC) 節點類型也提供兩種大小。大型節點具有 160GB 的 SSD 存儲、2 個 Intel Xeon E5-2670v2 (Ivy Bridge) 虛擬核心和 15GiB 的 RAM。八倍超大型節點是大型節點的 16 倍,具有 2.56TB 的 SSD 存儲、32 個 Intel Xeon E5-2670v2 虛擬核心和 244GiB 的 RAM。您可從每小時 0.25 USD 的單個 DC2.Large 節點開始,然后一路擴展至 128 個 8XL 節點,從而具有 326TB 的 SSD 存儲、3200 個虛擬內核和 24TiB 的 RAM。
    • Amazon Redshift 的 MPP 架構意味著可以通過增加數據倉庫群集中的節點數來提升性能。每個計算節點的最佳數據量取決于您的應用程序特點和查詢性能需求。一個 Amazon Redshift 數據倉庫群集中可以包含 1 到 128 個計算節點,具體取決于節點類型。

    盡管 Redshift Spectrum 非常適用于對 Amazon Redshift 和 S3 中的數據運行查詢,但它真的不適合企業通常需要使用 Amazon EMR 之類的處理框架進行處理的使用案例類型。Amazon EMR 的功能遠不止于運行 SQL 查詢。Amazon EMR 是一種托管服務,可讓您使用最新版本的常用大數據處理框架(如 Spark、Hadoop 和 Presto)在完全自定義的群集上處理和分析極大的數據集。借助 Amazon EMR,您可以為機器學習、圖形分析、數據轉換、流式處理數據以及您可以編寫代碼的幾乎任何應用程序運行各種擴展的數據處理任務。

    您可以將 Redshift Spectrum 與 EMR 配合使用。Redshift Spectrum 存儲表定義的方式與 Amazon EMR 相同。Redshift Spectrum 可以支持 Amazon EMR 使用的相同 Apache Hive 元數據倉來查詢數據和表定義。如果您使用的是 Amazon EMR 并擁有 Hive 元數據倉,則只需配置 Amazon Redshift 群集即可使用 Redshift Spectrum。然后,您可以馬上開始查詢這些數據和 Amazon EMR 任務。因此,如果您已經在使用 EMR 處理大型數據存儲,則可同時使用 Redshift Spectrum 來查詢這些數據,而不會影響 Amazon EMR 任務。

    ?

    Amazon Athena 是讓任何員工都能對 Amazon S3 中的數據運行臨時查詢的最簡單方式。Athena 是無服務器服務,因此您無需設置或管理基礎設施,即可立即開始分析數據。

    如果您擁有需要以一致且高度結構化的格式進行存儲的頻繁訪問數據,那么您應該使用 Amazon Redshift 之類的數據倉庫。這樣一來,您就可以在 Amazon Redshift 中靈活存儲結構化的頻繁訪問數據,并使用 Redshift Spectrum 將 Amazon Redshift 查詢擴展到 Amazon S3 數據湖中的所有數據。此外,您還可以靈活地將數據以您想要的格式存儲在您想要的位置,并在需要時即時可用。

    ?

    如果數據倉庫群集的可用區 (AZ) 發生故障,那么對數據倉庫群集可用性和數據持久性有何影響?

    如果 Amazon Redshift 數據倉庫群集的可用區無法使用,那么在 AZ 的電源及網絡訪問恢復之前,您將無法使用您的群集。數據倉庫群集的數據將被保留下來,一旦 AZ 重新可供使用,那么您就能夠開始使用 Amazon Redshift 數據倉庫。此外,您也可選擇將任何現有快照恢復到同一區域中的新 AZ 中。Amazon Redshift 將首先恢復您最頻繁訪問的數據,這樣您就能盡快地恢復查詢。

    當前 Amazon Redshift 僅支持單一可用區部署。通過將數據從同一組 Amazon S3 輸入文件加載到各個 AZ 中的兩個 Amazon Redshift 數據倉庫群集中,您便可在多個 AZ 中運行數據倉庫群集。借助 Redshift Spectrum,您可以跨可用區運行多個群集,并訪問 Amazon S3 中的數據,而無需將其加載到群集中。此外,您也可將數據倉庫群集從數據倉庫群集快照恢復至其他可用區。

    在加載數據時,Amazon Redshift 會復制數據倉庫群集內的所有數據并將其連續備份至 S3。Amazon Redshift 始終嘗試維持至少三份數據(計算節點上的正本數據、副本數據和 Amazon S3 上的備份數據)。Redshift 還能將您的快照異步復制到另一個區域的 S3 中進行災難恢復。默認情況下,Amazon Redshift 以一天的保留期啟用數據倉庫群集的自動化備份。您可將其配置為 35 天之久。免費備份存儲受限于數據倉庫群集中節點上的總存儲大小,并僅適用于已激活的數據倉庫群集。

    如何管理自動備份及快照保留期?

    您可以使用 AWS 管理控制臺或 ModifyDBInstance API,通過修改 RetentionPeriod 參數來管理自動備份的保留時間段。如果您希望關閉自動備份,則可以通過將保留期設置為 0(不建議)來執行該操作。Elastic Resize 幾分鐘內即可在單個 Redshift 集群中添加或刪除節點,以管理其查詢吞吐量。例如,一天內某幾個小時的 ETL 工作負載或月末報告可能需要額外 Redshift 資源才能按時完成。并發擴展會添加額外集群資源來提高整體查詢并發量。

    Redshift Spectrum 目前支持許多開源數據格式,其中包括 Avro、CSV、Grok、Ion、JSON、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile 和 TSV。

    Redshift Spectrum 目前支持 Gzip 和 Snappy 壓縮。

    轉載于:https://www.cnblogs.com/cloudrivers/p/11255311.html

    總結

    以上是生活随笔為你收集整理的Amazon Redshift 架构的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 国产高潮在线观看 | 国产一区黄 | 蜜桃av乱码一区二区三区 | 久久精品牌麻豆国产大山 | 国产精品国产精品国产专区不片 | 天堂网av中文字幕 | 亚洲av永久无码精品一区二区国产 | 国产情侣久久久久aⅴ免费 caoporn成人 | 六月婷婷色| av资源共享 | 在线视频日本 | 国产综合视频一区 | 日日插夜夜爽 | 中国白嫩丰满人妻videos | 激情xxxx | 国产美女在线观看 | 极品美女扒开粉嫩小泬 | wwwwww色| 成人三级电影网站 | www在线视频| 强伦人妻一区二区三区视频18 | 久草最新网址 | av网站免费大全 | 国产青草 | 天天躁日日躁bbbbb | 久久视频这里只有精品 | 久草大 | 亚洲视频在线视频 | 6080久久| 中文字幕在线1 | 精品免费 | 一二三四区视频 | 日本黄网站在线观看 | 草草屁屁影院 | 亚洲伦理自拍 | 欧美激情久久久久久久 | 天天摸天天爽 | 9999在线视频 | 69天堂网 | 男人舔女人下部高潮全视频 | 调教驯服丰满美艳麻麻在线视频 | 男人天堂手机在线观看 | 国产一区二区视频免费在线观看 | 91成人免费在线视频 | 九一国产精品 | jizz日本免费 | 亚洲区欧美 | 国产午夜精品在线观看 | 婷婷国产| 精品国产乱码久久久人妻 | 国产视频在线观看网站 | 久久成人免费视频 | 国产精品99无码一区二区 | 久久精品免费一区二区 | 国产精品久久久 | 91黄色入口| av在线资源 | 天堂网一区 | 久久久久久av无码免费网站 | 久久精品一 | 中文无码熟妇人妻av在线 | 色天使在线视频 | 成人小视频在线观看 | 国产精选视频在线观看 | 欧美一级片免费在线观看 | 日韩人妻一区二区三区 | 日日操狠狠操 | www,超碰| 欧美精品1区2区3区 精品成人一区 | 青草视频污| 一级特黄妇女高潮2 | 国产一级片在线 | 欧美一区二区三区久久妖精 | 国产精品久久久久久久久久久久久久 | www.久久国产 | av影院在线 | 亚洲欧美日韩久久精品 | 久久国产免费看 | 国精产品一区一区三区有限公司杨 | 亚洲免费av网址 | 人人射人人射 | 黑人巨大精品欧美一区二区蜜桃 | 特黄网站 | 中文字幕日韩久久 | 国产99久一区二区三区a片 | 日本欧美另类 | wwwxxx黄色 | 激情亚洲天堂 | 国产亚洲欧洲 | 亚洲天堂视频在线 | 欧美18一20男同69gay | 欧美伦理一区二区三区 | 古装做爰无遮挡三级聊斋艳谭 | jzzjzzjzz亚洲成熟少妇 | 久久婷婷一区二区 | 日批国产| 新91在线 | 污污内射久久一区二区欧美日韩 | 成人激情视频在线观看 |