一、前言
上一篇博文講解了Zookeeper的典型應(yīng)用場景,在大數(shù)據(jù)時(shí)代,各種分布式系統(tǒng)層出不窮,其中,有很多系統(tǒng)都直接或間接使用了Zookeeper,用來解決諸如配置管理、分布式通知/協(xié)調(diào)、集群管理和Master選舉等一系列分布式問題。
二、 Hadoop
Hadoop的核心是HDFS(Hadoop Distributed File System)和MapReduce,分別提供了對海量數(shù)據(jù)的存儲和計(jì)算能力,后來,Hadoop又引入了全新MapReduce框架YARN(Yet Another Resource Negotiator)。在Hadoop中,Zookeeper主要用于實(shí)現(xiàn)HA(High Availability),這部分邏輯主要集中在Hadoop Common的HA模塊中,HDFS的NameNode與YARN的ResourceManager都是基于此HA模塊來實(shí)現(xiàn)自己的HA功能,YARN又使用了Zookeeper來存儲應(yīng)用的運(yùn)行狀態(tài)。
YARN
YARN是一種新的 Hadoop 資源管理器,它是一個通用資源管理系統(tǒng),可為上層應(yīng)用提供統(tǒng)一的資源管理和調(diào)度,它的引入為集群在利用率、資源統(tǒng)一管理和數(shù)據(jù)共享等方面帶來了巨大好處。其可以支持MapReduce模型,同時(shí)也支持Tez、Spark、Storm、Impala、Open MPI等。
YARN主要由ResourceManager(RM)、NodeManager(NM)、ApplicationManager(AM)、Container四部分構(gòu)成。其中,ResourceManager為全局資源管理器,負(fù)責(zé)整個系統(tǒng)的資源管理和分配。由YARN體系架構(gòu)可以看到ResourceManager的單點(diǎn)問題,ResourceManager的工作狀況直接決定了整個YARN架構(gòu)是否可以正常運(yùn)轉(zhuǎn)。
ResourceManager HA
為了解決ResourceManager的單點(diǎn)問題,YARN設(shè)計(jì)了一套Active/Standby模式的ResourceManager HA架構(gòu)。
由上圖可知,在運(yùn)行期間,會有多個ResourceManager并存,并且其中只有一個ResourceManager處于Active狀態(tài),另外一些(允許一個或者多個)則處于Standby狀態(tài),當(dāng)Active節(jié)點(diǎn)無法正常工作時(shí),其余處于Standby狀態(tài)的節(jié)點(diǎn)則會通過競爭選舉產(chǎn)生新的Active節(jié)點(diǎn)。
主備切換
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26