一、前言
上一篇博文講解了Zookeeper的典型應(yīng)用場景,在大數(shù)據(jù)時代,各種分布式系統(tǒng)層出不窮,其中,有很多系統(tǒng)都直接或間接使用了Zookeeper,用來解決諸如配置管理、分布式通知/協(xié)調(diào)、集群管理和Master選舉等一系列分布式問題。
二、 Hadoop
Hadoop的核心是HDFS(Hadoop Distributed File System)和MapReduce,分別提供了對海量數(shù)據(jù)的存儲和計算能力,后來,Hadoop又引入了全新MapReduce框架YARN(Yet Another Resource Negotiator)。在Hadoop中,Zookeeper主要用于實現(xiàn)HA(High Availability),這部分邏輯主要集中在Hadoop Common的HA模塊中,HDFS的NameNode與YARN的ResourceManager都是基于此HA模塊來實現(xiàn)自己的HA功能,YARN又使用了Zookeeper來存儲應(yīng)用的運行狀態(tài)。
YARN
YARN是一種新的 Hadoop 資源管理器,它是一個通用資源管理系統(tǒng),可為上層應(yīng)用提供統(tǒng)一的資源管理和調(diào)度,它的引入為集群在利用率、資源統(tǒng)一管理和數(shù)據(jù)共享等方面帶來了巨大好處。其可以支持MapReduce模型,同時也支持Tez、Spark、Storm、Impala、Open MPI等。
YARN主要由ResourceManager(RM)、NodeManager(NM)、ApplicationManager(AM)、Container四部分構(gòu)成。其中,ResourceManager為全局資源管理器,負責(zé)整個系統(tǒng)的資源管理和分配。由YARN體系架構(gòu)可以看到ResourceManager的單點問題,ResourceManager的工作狀況直接決定了整個YARN架構(gòu)是否可以正常運轉(zhuǎn)。
ResourceManager HA
為了解決ResourceManager的單點問題,YARN設(shè)計了一套Active/Standby模式的ResourceManager HA架構(gòu)。
由上圖可知,在運行期間,會有多個ResourceManager并存,并且其中只有一個ResourceManager處于Active狀態(tài),另外一些(允許一個或者多個)則處于Standby狀態(tài),當(dāng)Active節(jié)點無法正常工作時,其余處于Standby狀態(tài)的節(jié)點則會通過競爭選舉產(chǎn)生新的Active節(jié)點。
主備切換