對(duì)于很多IT人來(lái)說(shuō)GREENPLUM是個(gè)陌生的名字。簡(jiǎn)單的說(shuō)它就是一個(gè)與ORACLE, DB2一樣面向?qū)ο蟮年P(guān)系型數(shù)據(jù)庫(kù)。我們通過(guò)標(biāo)準(zhǔn)的SQL可以對(duì)GP中的數(shù)據(jù)進(jìn)行訪問(wèn)存取。
本質(zhì)上講GREENPLUM是一個(gè)關(guān)系型數(shù)據(jù)庫(kù)集群. 它實(shí)際上是由數(shù)個(gè)獨(dú)立的數(shù)據(jù)庫(kù)服務(wù)組合成的邏輯數(shù)據(jù)庫(kù)。與RAC不同,這種數(shù)據(jù)庫(kù)集群采取的是MPP架構(gòu)。如下圖所示
它的組件分成三個(gè)部分MASTER/SEGMENT以及MASTER與SEGMENT之間的高效互聯(lián)技術(shù)GNET。其中MASTER和SEGMENT本身就是獨(dú)立的數(shù)據(jù)庫(kù)SERVER。不同之處在于,MASTER只負(fù)責(zé)應(yīng)用的連接,生成并拆分執(zhí)行計(jì)劃,把執(zhí)行計(jì)劃分配給SEGMENT節(jié)點(diǎn),以及返回最終結(jié)果給應(yīng)用,它只存儲(chǔ)一些數(shù)據(jù)庫(kù)的元數(shù)據(jù),不負(fù)責(zé)運(yùn)算,因此不會(huì)成為系統(tǒng)性能的瓶頸。這也是GREENPLUM與傳統(tǒng)MPP架構(gòu)數(shù)據(jù)庫(kù)的一個(gè)重要區(qū)別。 SEGMENT節(jié)點(diǎn)存儲(chǔ)用戶的業(yè)務(wù)數(shù)據(jù),并根據(jù)得到執(zhí)行計(jì)劃,負(fù)責(zé)處理業(yè)務(wù)數(shù)據(jù)。也就是用戶關(guān)系表的數(shù)據(jù)會(huì)打散分布到每個(gè)SEGMENGT節(jié)點(diǎn)。當(dāng)進(jìn)行數(shù)據(jù)訪問(wèn)時(shí),首先所有SEGMENT并行處理與自己有關(guān)的數(shù)據(jù),如果需要segment可以通過(guò)進(jìn)行innterconnect進(jìn)行彼此的數(shù)據(jù)交互。 segment節(jié)點(diǎn)越多,數(shù)據(jù)就會(huì)打的越散,處理速度就越快。因此與SHARE ALL數(shù)據(jù)庫(kù)集群不同,通過(guò)增加SEGMENT節(jié)點(diǎn)服務(wù)器的數(shù)量,GREENPLUM的性能會(huì)成線性增長(zhǎng)。
安裝之前看了一些關(guān)于greenplun的文章,介紹和解釋地實(shí)在難以讓人滿意,結(jié)合官網(wǎng),記錄一下自己的搭建過(guò)程.
greenplum集群一共有三個(gè)角色,主節(jié)點(diǎn),備節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn),理論上至少要有三臺(tái)機(jī)器,如果條件差一些,備用節(jié)點(diǎn)去掉后續(xù)再添加也可以
10.10.10.1 master節(jié)點(diǎn)
10.10.10.2 standby節(jié)點(diǎn)
10.10.10.3 data1節(jié)點(diǎn)
10.10.10.4 data2節(jié)點(diǎn)
系統(tǒng)都為centos7
下載地址: https://network.pivotal.io/products/pivotal-gpdb/(包括jdbc連