Co to jest automatyczne przełączanie awaryjne NameNode w Hadoop HDFS?

W tym samouczku Hadoop , omówimy koncepcję automatycznego przełączania awaryjnego NameNode w Hadoop. Przede wszystkim zobaczymy, co to jest przełączanie awaryjne i rodzaje przełączania awaryjnego. Następnie omówimy HDFS automatyczne przełączanie awaryjne w Hadoop.

Składniki automatycznego przełączania awaryjnego Hadoop w HDFS, takie jak kworum ZooKeeper, proces ZKFailoverController (ZKFC). Na koniec omówimy również role tych dwóch komponentów w Hadoop .

Co to jest przełączanie awaryjne?

Proces, w którym system przekazuje kontrolę do systemu wtórnego po wykryciu awarii, jest znany jako przełączenie awaryjne .

Przełączanie awaryjne jest dwojakiego rodzaju:

Pełne przełączanie awaryjne – Administrator ręcznie inicjuje Graceful Failover, na przykład w przypadku rutynowej konserwacji. System nie aktywuje automatycznie przełączania awaryjnego z aktywnego węzła nazwy do stanu gotowości, nawet jeśli aktywny węzeł nie zadziałał w trybie Graceful Failover.

Automatyczne przełączanie awaryjne – Automatyczne przełączanie awaryjne to proces, w którym system automatycznie przekazuje kontrolę do rezerwowego NameNode, gdy NameNode ulegnie awarii. W Hadoop automatyczne przełączanie awaryjne występuje w przypadku awarii NameNode. Ale w przypadku awarii NameNode, Failover uruchomi się automatycznie. To przełączanie awaryjne to automatyczne przełączanie awaryjne.

NameNode Automatyczne przełączanie awaryjne w Hadoop

Automatyczne przełączanie awaryjne w Hadoop dodaje poniższe składniki do wdrożenia Hadoop HDFS:

Kworum ZooKeepera.
Proces ZKFailoverController (ZKFC).

1. Kworum ZooKeepera

Zookeeper w Hadoop to scentralizowana usługa. Utrzymuje informacje o konfiguracji, nazewnictwo i zapewnia rozproszoną synchronizację. Świadczy również usługi grupowe. Zookeeper zarządza również i koordynuje dużą grupę maszyn.

Z poniższych powodów implementacja automatycznego przełączania awaryjnego HDFS opiera się na Zookeeperze:

Wykrywanie awarii- Zookeeper w Hadoop prowadzi sesję z nazwami. W przypadku awarii sesja wygaśnie. Tak więc Zookeeper poinformuje inne namenody o rozpoczęciu procesu przełączania awaryjnego.
Aktywny wybór NameNode- Prosty mechanizm zapewniany przez Zookeeper, aby wybrać tylko węzeł jako aktywny. W momencie awarii aktywnego namenoda, inny namenode może przyjąć wyłączną blokadę w Zookeeperze, stwierdzając, że chce zostać następnym aktywnym namenodem.

2. ZKFailoverController (ZKFC)

ZKFC jest klientem Zookeeper w Hadoop, który monitoruje i zarządza statusem nazwy. Każda z maszyn, które uruchamiają usługę namenode, obsługuje również ZKFS. Może obsłużyć:

Monitorowanie zdrowia – Za pomocą polecenia sprawdzania kondycji ZKFS pinguje swój lokalny nazwanode. ZKFS uważa, że nazwanode jest zdrowe, o ile nazwanode odpowiada w danym momencie. Monitor stanu oznaczy węzeł jako zły, jeśli węzeł uległ awarii lub wszedł w stan złej kondycji.
Zarządzanie sesją Zookeeper – ZKFC otwiera sesję w Zookeeperze, gdy lokalny nazwanode jest sprawny. Zawiera również specjalny węzeł „blokady”, jeśli lokalny węzeł nazwy jest aktywny. Jeśli sesja wygaśnie, blokada zostanie automatycznie usunięta.
Wybory oparte na zookeeper – W HDFS, jeśli lokalny namenode jest sprawny, a ZKFC widzi, że żaden inny węzeł aktualnie nie posiada węzła blokady, sam spróbuje uzyskać blokadę. A jeśli się powiedzie, oznacza to, że wygrał wybory” i obsługuje przełączanie awaryjne, aby uaktywnić swój lokalny nazwanode.

Wniosek

Dlatego automatyczne przełączanie awaryjne w Hadoop uruchamia się automatycznie w przypadku awarii NameNode. Automatyczne przełączanie awaryjne dodaje komponenty kworum ZooKeeper i ZKFailoverController Process (ZKFC) do wdrożenia HDFS.

Zookeeper w Hadoop to usługa, która zapewnia automatyczną możliwość przełączania awaryjnego w HDFS .