一、前言

前面已經講解了Zookeeper的一些應用場景,但是并沒有深入到Zookeeper內部進行分析,本篇將講解其系統(tǒng)模型。

二、系統(tǒng)模型

2.1 數據模型

Zookeeper的數據節(jié)點稱為ZNode,ZNode是Zookeeper中數據的最小單元,每個ZNode都可以保存數據,同時還可以掛載子節(jié)點,因此構成了一個層次化的命名空間,稱為樹。

在Zookeeper中,事務是指能夠改變Zookeeper服務器狀態(tài)的操作,一般包括節(jié)點創(chuàng)建與刪除,數據節(jié)點內容更新和客戶端會話創(chuàng)建與失效,對于每個事務請求,Zookeeper都會為其分配一個全局唯一的事務ID,用ZXID表示,通常是64位的數字,每個ZXID對應一次更新操作,從這些ZXID中可以間接地識別出Zookeeper處理這些更新操作請求的全局順序。

2.2 節(jié)點特性

在Zookeeper中,每個數據節(jié)點都是由生命周期的,類型不同則會不同的生命周期,節(jié)點類型可以分為持久節(jié)點(PERSISTENT)、臨時節(jié)點(EPHEMERAL)、順序節(jié)點(SEQUENTIAL)三大類,可以通過組合生成如下四種類型節(jié)點

1. 持久節(jié)點(PERSISTENT)。節(jié)點創(chuàng)建后便一直存在于Zookeeper服務器上,直到有刪除操作來主動清楚該節(jié)點。

2. 持久順序節(jié)點(PERSISTENT_SEQUENTIAL)。相比持久節(jié)點,其新增了順序特性,每個父節(jié)點都會為它的第一級子節(jié)點維護一份順序,用于記錄每個子節(jié)點創(chuàng)建的先后順序。在創(chuàng)建節(jié)點時,會自動添加一個數字后綴,作為新的節(jié)點名,該數字后綴的上限是整形的最大值。

3. 臨時節(jié)點(EPEMERAL)。臨時節(jié)點的生命周期與客戶端會話綁定,客戶端失效,節(jié)點會被自動清理。同時,Zookeeper規(guī)定不能基于臨時節(jié)點來創(chuàng)建子節(jié)點,即臨時節(jié)點只能作為葉子節(jié)點。

4. 臨時順序節(jié)點(EPEMERAL_SEQUENTIAL)。在臨時節(jié)點的基礎添加了順序特性。

每個節(jié)點除了存儲數據外,還存儲了節(jié)點本身的一些狀態(tài)信息,可通過get命令獲取。

2.3 版本--保證分布式數據原子性操作

每個數據節(jié)點都具有三種類型的版本信息,對數據節(jié)點的任何更新操作都會引起版本號的變化。

version-- 當前數據節(jié)點數據內容的版本號

cversion-- 當前數據子節(jié)點的版本號

aversion-- 當前數據節(jié)點ACL變更版本號

上述各版本號都是表示修改次數,如version為1表示對數據節(jié)點的內容變更了一次。即使前后兩次變更并沒有改變數據內容,version的值仍然會改變。version可以用于寫入驗證,類似于CAS。

2.4 Watcher--數據變更通知

Zookeeper使用Watcher機制實現分布式數據的發(fā)布/訂閱功能。

Zookeeper的Watcher機制主要包括客戶端線程、客戶端WatcherManager、Zookeeper服務器三部分??蛻舳嗽谙騔ookeeper服務器注冊的同時,會將Watcher對象存儲在客戶端的WatcherManager當中。當Zookeeper服務器觸發(fā)Watcher事件后,會向客戶端發(fā)送通知,客戶端線程從WatcherManager中取出對應的Watcher對象來執(zhí)行回調邏輯。

2.5 ACL--保障數據的安全

Zookeeper內部存儲了分布式系統(tǒng)運行時狀態(tài)的元數據,這些元數據會直接影響基于Zookeeper進行構造的分布式系統(tǒng)的運行狀態(tài),如何保障系統(tǒng)中數據的安全,從而避免因誤操作而帶來的數據隨意變更而導致的數據庫異常