HBase
 sql >> Baza danych >  >> NoSQL >> HBase

Co to jest automatyczne przełączanie awaryjne NameNode w Hadoop HDFS?

W tym samouczku Hadoop , omówimy koncepcję automatycznego przełączania awaryjnego NameNode w Hadoop. Przede wszystkim zobaczymy, co to jest przełączanie awaryjne i rodzaje przełączania awaryjnego. Następnie omówimy HDFS automatyczne przełączanie awaryjne w Hadoop.

Składniki automatycznego przełączania awaryjnego Hadoop w HDFS, takie jak kworum ZooKeeper, proces ZKFailoverController (ZKFC). Na koniec omówimy również role tych dwóch komponentów w Hadoop .

Co to jest przełączanie awaryjne?

Proces, w którym system przekazuje kontrolę do systemu wtórnego po wykryciu awarii, jest znany jako przełączenie awaryjne .

Przełączanie awaryjne jest dwojakiego rodzaju:

  • Pełne przełączanie awaryjne – Administrator ręcznie inicjuje Graceful Failover, na przykład w przypadku rutynowej konserwacji. System nie aktywuje automatycznie przełączania awaryjnego z aktywnego węzła nazwy do stanu gotowości, nawet jeśli aktywny węzeł nie zadziałał w trybie Graceful Failover.
  • Automatyczne przełączanie awaryjne –  Automatyczne przełączanie awaryjne to proces, w którym system automatycznie przekazuje kontrolę do rezerwowego NameNode, gdy NameNode ulegnie awarii. W Hadoop automatyczne przełączanie awaryjne występuje w przypadku awarii NameNode. Ale w przypadku awarii NameNode, Failover uruchomi się automatycznie. To przełączanie awaryjne to automatyczne przełączanie awaryjne.

NameNode Automatyczne przełączanie awaryjne w Hadoop

Automatyczne przełączanie awaryjne w Hadoop dodaje poniższe składniki do wdrożenia Hadoop HDFS:

  • Kworum ZooKeepera.
  • Proces ZKFailoverController (ZKFC).

1. Kworum ZooKeepera

Zookeeper w Hadoop to scentralizowana usługa. Utrzymuje informacje o konfiguracji, nazewnictwo i zapewnia rozproszoną synchronizację. Świadczy również usługi grupowe. Zookeeper zarządza również i koordynuje dużą grupę maszyn.

Z poniższych powodów implementacja automatycznego przełączania awaryjnego HDFS opiera się na Zookeeperze:

  • Wykrywanie awarii- Zookeeper w Hadoop prowadzi sesję z nazwami. W przypadku awarii sesja wygaśnie. Tak więc Zookeeper poinformuje inne namenody o rozpoczęciu procesu przełączania awaryjnego.
  • Aktywny wybór NameNode- Prosty mechanizm zapewniany przez Zookeeper, aby wybrać tylko węzeł jako aktywny. W momencie awarii aktywnego namenoda, inny namenode może przyjąć wyłączną blokadę w Zookeeperze, stwierdzając, że chce zostać następnym aktywnym namenodem.

2. ZKFailoverController (ZKFC)

ZKFC jest klientem Zookeeper w Hadoop, który monitoruje i zarządza statusem nazwy. Każda z maszyn, które uruchamiają usługę namenode, obsługuje również ZKFS. Może obsłużyć:

  • Monitorowanie zdrowia – Za pomocą polecenia sprawdzania kondycji ZKFS pinguje swój lokalny nazwanode. ZKFS uważa, że ​​nazwanode jest zdrowe, o ile nazwanode odpowiada w danym momencie. Monitor stanu oznaczy węzeł jako zły, jeśli węzeł uległ awarii lub wszedł w stan złej kondycji.
  • Zarządzanie sesją Zookeeper –  ZKFC otwiera sesję w Zookeeperze, gdy lokalny nazwanode jest sprawny. Zawiera również specjalny węzeł „blokady”, jeśli lokalny węzeł nazwy jest aktywny. Jeśli sesja wygaśnie, blokada zostanie automatycznie usunięta.
  • Wybory oparte na zookeeper –  W HDFS, jeśli lokalny namenode jest sprawny, a ZKFC widzi, że żaden inny węzeł aktualnie nie posiada węzła blokady, sam spróbuje uzyskać blokadę. A jeśli się powiedzie, oznacza to, że wygrał wybory” i obsługuje przełączanie awaryjne, aby uaktywnić swój lokalny nazwanode.

Wniosek

Dlatego automatyczne przełączanie awaryjne w Hadoop uruchamia się automatycznie w przypadku awarii NameNode. Automatyczne przełączanie awaryjne dodaje komponenty kworum ZooKeeper i ZKFailoverController Process (ZKFC) do wdrożenia HDFS.

Zookeeper w Hadoop to usługa, która zapewnia automatyczną możliwość przełączania awaryjnego w HDFS .


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. How-to:Użyj HBase Bulk Loading i dlaczego

  2. Liczniki Hadoop i typy liczników w MapReduce

  3. Wewnątrz architektury pozyskiwania danych w czasie zbliżonym do rzeczywistego Santander (część 2)

  4. Wysoka dostępność (Multi-AZ) dla operacyjnej bazy danych CDP

  5. Budowanie prostej aplikacji internetowej CRUD i sklepu z obrazami przy użyciu operacyjnej bazy danych Cloudera i Flask