對于很多IT人來說GREENPLUM是個陌生的名字。簡單的說它就是一個與ORACLE, DB2一樣面向?qū)ο蟮年P系型數(shù)據(jù)庫。我們通過標準的SQL可以對GP中的數(shù)據(jù)進行訪問存取。
本質(zhì)上講GREENPLUM是一個關系型數(shù)據(jù)庫集群. 它實際上是由數(shù)個獨立的數(shù)據(jù)庫服務組合成的邏輯數(shù)據(jù)庫。與RAC不同,這種數(shù)據(jù)庫集群采取的是MPP架構。如下圖所示
它的組件分成三個部分MASTER/SEGMENT以及MASTER與SEGMENT之間的高效互聯(lián)技術GNET。其中MASTER和SEGMENT本身就是獨立的數(shù)據(jù)庫SERVER。不同之處在于,MASTER只負責應用的連接,生成并拆分執(zhí)行計劃,把執(zhí)行計劃分配給SEGMENT節(jié)點,以及返回最終結果給應用,它只存儲一些數(shù)據(jù)庫的元數(shù)據(jù),不負責運算,因此不會成為系統(tǒng)性能的瓶頸。這也是GREENPLUM與傳統(tǒng)MPP架構數(shù)據(jù)庫的一個重要區(qū)別。 SEGMENT節(jié)點存儲用戶的業(yè)務數(shù)據(jù),并根據(jù)得到執(zhí)行計劃,負責處理業(yè)務數(shù)據(jù)。也就是用戶關系表的數(shù)據(jù)會打散分布到每個SEGMENGT節(jié)點。當進行數(shù)據(jù)訪問時,首先所有SEGMENT并行處理與自己有關的數(shù)據(jù),如果需要segment可以通過進行innterconnect進行彼此的數(shù)據(jù)交互。 segment節(jié)點越多,數(shù)據(jù)就會打的越散,處理速度就越快。因此與SHARE ALL數(shù)據(jù)庫集群不同,通過增加SEGMENT節(jié)點服務器的數(shù)量,GREENPLUM的性能會成線性增長。
安裝之前看了一些關于greenplun的文章,介紹和解釋地實在難以讓人滿意,結合官網(wǎng),記錄一下自己的搭建過程.
greenplum集群一共有三個角色,主節(jié)點,備節(jié)點和數(shù)據(jù)節(jié)點,理論上至少要有三臺機器,如果條件差一些,備用節(jié)點去掉后續(xù)再添加也可以
10.10.10.1 master節(jié)點
10.10.10.2 standby節(jié)點
10.10.10.3 data1節(jié)點
10.10.10.4 data2節(jié)點
系統(tǒng)都為centos7
下載地址: https://network.pivotal.io/products/pivotal-gpdb/(包括jdbc連