Greenplum数据库(GPDB)初识
1、特性
Greenplum數據庫(GPDB),分布式數據庫,數據倉庫快速查詢工具,特性:
1)GPDB完全支持ANSI SQL 2008標準和SQL OLAP 2003 擴展,從應用編程接口上講,它支持ODBC和JDBC;和 NoSQL、NewSQL和Hadoop 等不支持 SQL不一樣 ;
2)支持分布式事務,支持ACID;保證數據的強一致性。
3)分布式數據庫,擁有良好的線性擴展能力。
我的一個簡單理解就是:Hadoop和GPDB都是分布式集群(分布式存儲和分布式計算),不同的是GPDB是支持SQL標準,或者說處理和存儲結構化數據,適用OLAP和OLTP,適用數據集市和數據倉庫的建設。
2、架構
數據庫由Master Severs和Segment Severs通過Interconnect互聯組成。
1)Master主機負責:建立與客戶端的連接和管理;SQL的解析并形成執行計劃;執行計劃向Segment的分發收集Segment的執行結果;Master不存儲業務數據,只存儲數據字典。 ?
2)Segment主機負責:業務數據的存儲和存取;用戶查詢SQL的執行。?
Master類似于Hadoop平臺的Namenode,而Segment則類似于Hadoop平臺的Datanode。
?greenplum使用mpp架構。
?greenplum部署體系
3、Master節點:
master node高可用,類似于hadoop的namenode和second namenode,實現主備的高可用。
4、Segments節點
5、管理
1)數據裝載和性能監控
2)并行備份和恢復
3)數據訪問流程
4)查詢流程:分查詢創建和查詢分發,計算后將結果返回
5)分布存儲
數據的分布,分為hash分布和隨機分布兩種。
在線數據分布:均勻分布
總結
以上是生活随笔為你收集整理的Greenplum数据库(GPDB)初识的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习笔记(十二)计算学习理论
- 下一篇: 【正一专栏】第1球和第500球价值一样