一、前言

前面已經(jīng)講解了Zookeeper的一些應(yīng)用場景,但是并沒有深入到Zookeeper內(nèi)部進(jìn)行分析,本篇將講解其系統(tǒng)模型。

二、系統(tǒng)模型

2.1 數(shù)據(jù)模型

Zookeeper的數(shù)據(jù)節(jié)點(diǎn)稱為ZNode,ZNode是Zookeeper中數(shù)據(jù)的最小單元,每個(gè)ZNode都可以保存數(shù)據(jù),同時(shí)還可以掛載子節(jié)點(diǎn),因此構(gòu)成了一個(gè)層次化的命名空間,稱為樹。

在Zookeeper中,事務(wù)是指能夠改變Zookeeper服務(wù)器狀態(tài)的操作,一般包括節(jié)點(diǎn)創(chuàng)建與刪除,數(shù)據(jù)節(jié)點(diǎn)內(nèi)容更新和客戶端會話創(chuàng)建與失效,對于每個(gè)事務(wù)請求,Zookeeper都會為其分配一個(gè)全局唯一的事務(wù)ID,用ZXID表示,通常是64位的數(shù)字,每個(gè)ZXID對應(yīng)一次更新操作,從這些ZXID中可以間接地識別出Zookeeper處理這些更新操作請求的全局順序。

2.2 節(jié)點(diǎn)特性

在Zookeeper中,每個(gè)數(shù)據(jù)節(jié)點(diǎn)都是由生命周期的,類型不同則會不同的生命周期,節(jié)點(diǎn)類型可以分為持久節(jié)點(diǎn)(PERSISTENT)、臨時(shí)節(jié)點(diǎn)(EPHEMERAL)、順序節(jié)點(diǎn)(SEQUENTIAL)三大類,可以通過組合生成如下四種類型節(jié)點(diǎn)

1. 持久節(jié)點(diǎn)(PERSISTENT)。節(jié)點(diǎn)創(chuàng)建后便一直存在于Zookeeper服務(wù)器上,直到有刪除操作來主動清楚該節(jié)點(diǎn)。

2. 持久順序節(jié)點(diǎn)(PERSISTENT_SEQUENTIAL)。相比持久節(jié)點(diǎn),其新增了順序特性,每個(gè)父節(jié)點(diǎn)都會為它的第一級子節(jié)點(diǎn)維護(hù)一份順序,用于記錄每個(gè)子節(jié)點(diǎn)創(chuàng)建的先后順序。在創(chuàng)建節(jié)點(diǎn)時(shí),會自動添加一個(gè)數(shù)字后綴,作為新的節(jié)點(diǎn)名,該數(shù)字后綴的上限是整形的最大值。

3. 臨時(shí)節(jié)點(diǎn)(EPEMERAL)。臨時(shí)節(jié)點(diǎn)的生命周期與客戶端會話綁定,客戶端失效,節(jié)點(diǎn)會被自動清理。同時(shí),Zookeeper規(guī)定不能基于臨時(shí)節(jié)點(diǎn)來創(chuàng)建子節(jié)點(diǎn),即臨時(shí)節(jié)點(diǎn)只能作為葉子節(jié)點(diǎn)。

4. 臨時(shí)順序節(jié)點(diǎn)(EPEMERAL_SEQUENTIAL)。在臨時(shí)節(jié)點(diǎn)的基礎(chǔ)添加了順序特性。

每個(gè)節(jié)點(diǎn)除了存儲數(shù)據(jù)外,還存儲了節(jié)點(diǎn)本身的一些狀態(tài)信息,可通過get命令獲取。

2.3 版本--保證分布式數(shù)據(jù)原子性操作

每個(gè)數(shù)據(jù)節(jié)點(diǎn)都具有三種類型的版本信息,對數(shù)據(jù)節(jié)點(diǎn)的任何更新操作都會引起版本號的變化。

version-- 當(dāng)前數(shù)據(jù)節(jié)點(diǎn)數(shù)據(jù)內(nèi)容的版本號

cversion-- 當(dāng)前數(shù)據(jù)子節(jié)點(diǎn)的版本號

aversion-- 當(dāng)前數(shù)據(jù)節(jié)點(diǎn)ACL變更版本號

上述各版本號都是表示修改次數(shù),如version為1表示對數(shù)據(jù)節(jié)點(diǎn)的內(nèi)容變更了一次。即使前后兩次變更并沒有改變數(shù)據(jù)內(nèi)容,version的值仍然會改變。version可以用于寫入驗(yàn)證,類似于CAS。

2.4 Watcher--數(shù)據(jù)變更通知

Zookeeper使用Watcher機(jī)制實(shí)現(xiàn)分布式數(shù)據(jù)的發(fā)布/訂閱功能。

Zookeeper的Watcher機(jī)制主要包括客戶端線程、客戶端WatcherManager、Zookeeper服務(wù)器三部分。客戶端在向Zookeeper服務(wù)器注冊的同時(shí),會將Watcher對象存儲在客戶端的WatcherManager當(dāng)中。當(dāng)Zookeeper服務(wù)器觸發(fā)Watcher事件后,會向客戶端發(fā)送通知,客戶端線程從WatcherManager中取出對應(yīng)的Watcher對象來執(zhí)行回調(diào)邏輯。

2.5 ACL--保障數(shù)據(jù)的安全

Zookeeper內(nèi)部存儲了分布式系統(tǒng)運(yùn)行時(shí)狀態(tài)的元數(shù)據(jù),這些元數(shù)據(jù)會直接影響基于Zookeeper進(jìn)行構(gòu)造的分布式系統(tǒng)的運(yùn)行狀態(tài),如何保障系統(tǒng)中數(shù)據(jù)的安全,從而避免因誤操作而帶來的數(shù)據(jù)隨意變更而導(dǎo)致的數(shù)據(jù)庫異常