Zookeeper主要用在分布式應(yīng)用中實(shí)現(xiàn)一致性協(xié)調(diào)調(diào)度服務(wù)。它的命名空間類似傳統(tǒng)文件系統(tǒng),每個(gè)節(jié)點(diǎn)都以唯一的路徑進(jìn)行標(biāo)識(shí),不同的是,每個(gè)節(jié)點(diǎn)除了可以擁有子節(jié)點(diǎn)外,還可擁有相對(duì)性的data數(shù)據(jù)。
一、Zookeeper命名空間
上圖是一個(gè)典型的Zookeeper命名空間結(jié)構(gòu),通過(guò)路徑"/app1/p_1"可訪問(wèn)znode1節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)可存儲(chǔ)少量數(shù)據(jù),如狀態(tài)、配置、位置信息等等,且data信息量很小,一般在byte到KB級(jí)別。節(jié)點(diǎn)znode維護(hù)一個(gè)狀態(tài)stat結(jié)構(gòu)(包括數(shù)據(jù)變化的版本號(hào)、ACL變化、時(shí)間戳),以允許緩存驗(yàn)證與協(xié)調(diào)更新。每當(dāng)節(jié)點(diǎn)數(shù)據(jù)內(nèi)容改變時(shí),多一個(gè)版本號(hào),類似HBase??蛻舳双@取數(shù)據(jù)的同時(shí)也獲取相對(duì)應(yīng)的版本號(hào)。節(jié)點(diǎn)數(shù)據(jù)內(nèi)容以原子方式讀寫,讀操作會(huì)讀取該znode的全部data數(shù)據(jù),同樣寫操作也會(huì)覆蓋該znode的全部data數(shù)據(jù),不存在部分讀寫的情況。同時(shí),每個(gè)節(jié)點(diǎn)有一個(gè)訪問(wèn)控制列表ACL(Access Control List)來(lái)約束訪問(wèn)操作,即具有權(quán)限控制。
znode存在兩種:
常規(guī)的znode: 由用戶顯式創(chuàng)建和刪除
ephemeral znode:臨時(shí)型znode, 其生命周期伴隨于創(chuàng)建它的session, session結(jié)束后,ZooKeeper Server會(huì)自動(dòng)刪除它,當(dāng)然用戶也可以顯式的刪除
二、Zookeeper的Watches