日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

海量数据处理利器greenplum——初识

發布時間:2025/4/5 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 海量数据处理利器greenplum——初识 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

https://www.cnblogs.com/skyme/p/5779885.html

簡介及適用場景

如果想在數據倉庫中快速查詢結果,可以使用greenplum。

Greenplum數據庫也簡稱GPDB。它擁有豐富的特性:

第一,完善的標準支持:GPDB完全支持ANSI SQL 2008標準和SQL OLAP 2003 擴展;從應用編程接口上講,它支持ODBC和JDBC。完善的標準支持使得系統開發、維護和管理都大為方便。而現在的 NoSQL,NewSQL和Hadoop 對 SQL 的支持都不完善,不同的系統需要單獨開發和管理,且移植性不好。

第二,支持分布式事務,支持ACID。保證數據的強一致性。

第三,做為分布式數據庫,擁有良好的線性擴展能力。在國內外用戶生產環境中,具有上百個物理節點的GPDB集群都有很多案例。

第四,GPDB是企業級數據庫產品,全球有上千個集群在不同客戶的生產環境運行。這些集群為全球很多大的金融、政府、物流、零售等公司的關鍵業務提供服務。

第五,GPDB是Greenplum(現在的Pivotal)公司十多年研發投入的結果。GPDB基于PostgreSQL 8.2,PostgreSQL 8.2有大約80萬行源代碼,而GPDB現在有130萬行源碼。相比PostgreSQL 8.2,增加了約50萬行的源代碼。

第六,Greenplum有很多合作伙伴,GPDB有完善的生態系統,可以與很多企業級產品集成,譬如SAS,Cognos,Informatic,Tableau等;也可以很多種開源軟件集成,譬如Pentaho,Talend 等。

greenplum起源

Greenplum最早是在10多年前(大約在2002年)出現的,基本上和Hadoop是同一時期(Hadoop 約是2004年前后,早期的Nutch可追溯到2002年)。當時的背景是:

  • 互聯網行業經過之前近10年的由慢到快的發展,累積了大量信息和數據,數據在爆發式增長,這些海量數據急需新的計算方式,需要一場計算方式的革命;
  • 傳統的主機計算模式在海量數據面前,除了造價昂貴外,在技術上也難于滿足數據計算性能指標,傳統主機的Scale-up模式遇到了瓶頸,SMP(對稱多處理)架構難于擴展,并且在CPU計算和IO吞吐上不能滿足海量數據的計算需求;
  • 分布式存儲和分布式計算理論剛剛被提出來,Google的兩篇著名論文發表后引起業界的關注,一篇是關于GFS分布式文件系統,另外一篇是關于MapReduce 并行計算框架的理論,分布式計算模式在互聯網行業特別是收索引擎和分詞檢索等方面獲得了巨大成功。

下圖就是GFS的架構

總體架構

greenplum的總體架構如下:

? 數據庫由Master Severs和Segment Severs通過Interconnect互聯組成。

Master主機負責:建立與客戶端的連接和管理;SQL的解析并形成執行計劃;執行計劃向Segment的分發收集Segment的執行結果;Master不存儲業務數據,只存儲數據字典。??

Segment主機負責:業務數據的存儲和存取;用戶查詢SQL的執行。?

? greenplum使用mpp架構。

??? 基本體系架構

master節點,可以做成高可用的架構

master node高可用,類似于hadoop的namenode和second namenode,實現主備的高可用。

segments節點

并行管理

對于數據的裝載和性能監控。

并行備份和恢復。

數據訪問流程,數據分布到不同顏色的節點上

查詢流程分為查詢創建和查詢分發,計算后將結果返回。

對于存儲,將存儲的內容分布到各個結點上。

對于數據的分布,分為hash分布和隨機分布兩種。

均勻分布的情況:

總結

GPDB從開始設計的時候就被定義成數據倉庫,如果是olap的應用,可以嘗試使用GPDB。

轉載于:https://www.cnblogs.com/davidwang456/articles/10220244.html

總結

以上是生活随笔為你收集整理的海量数据处理利器greenplum——初识的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。