HBase
 sql >> Baza danych >  >> NoSQL >> HBase

Operacyjna baza danych w CDP

Nota redaktora, sierpień 2020 r.:CDP Data Center nosi teraz nazwę CDP Private Cloud Base. Więcej informacji na ten temat znajdziesz tutaj.

Operacyjna baza danych Cloudera (OpDB) w CDP dostarcza w czasie rzeczywistym, zawsze dostępną, skalowalną OpDB, która obsługuje tradycyjne dane strukturalne wraz z nowymi danymi niestrukturalnymi w ramach ujednoliconej platformy operacyjnej i magazynowej. Cloudera dostarcza operacyjną bazę danych, która obsługuje tradycyjne ustrukturyzowane dane wraz z nowymi nieustrukturyzowanymi danymi w ramach zunifikowanej platformy open source.

Operacyjna baza danych pomaga:

Operacjonalizacja uczenia maszynowego/sztucznej inteligencji, aby zrewolucjonizować sektory, takie jak opieka zdrowotna, usługi użyteczności publicznej itp.

  • Wyświetlaj treści w czasie rzeczywistym w skali internetowej.
  • Wspieraj analizy dużych zbiorów danych do zastosowań operacyjnych i offline.
  • Używaj jako odpornego magazynu danych.

OpDB w CDP jest obecnie dostępny w dwóch formach:jako w pełni bezpieczna, częściowo zarządzana oferta w CDP Public Cloud – Data Hub oraz jako w pełni konfigurowalna oferta w CDP Data Center – podobna do tej, która jest już dostępna w CDH i HDP. Możesz wybrać współczynnik kształtu w oparciu o strategię wdrażania i potrzeby OpDB. Operacyjna baza danych wykorzystuje składnicę obiektów, taką jak Amazon S3, jako warstwę pamięci dla Apache HBase, gdzie pliki HFiles są zapisywane w składnicy obiektów, ale pliki WAL są zapisywane w systemie HDFS.

Operacyjna baza danych w CDP składa się z następujących komponentów:

  • Apache Phoenix to interfejs SQL działający na bazie Apache HBase.
  • Apache HBase zaprojektowano z myślą o ogromnej skalowalności, dzięki czemu możesz przechowywać nieograniczone ilości danych na jednej platformie i obsługiwać rosnące wymagania dotyczące udostępniania danych.
  • Apache ZooKeeper zapewnia usługę konfiguracji rozproszonej, usługę synchronizacji i rejestr nazw.
  • Apache Knox Gateway zapewnia bezpieczeństwo obwodowe, dzięki czemu przedsiębiorstwo może bez obaw rozszerzyć dostęp na nowych użytkowników.
  • Apache HDFS jest używany do pisania Apache HBase WALs.
  • magazyn obiektów, taki jak Amazon S3 i Microsoft ADLS Gen2, służy do przechowywania Apache HBase HFiles.
  • Shared Data Experience (SDX) jest używany do funkcji bezpieczeństwa i zarządzania. Zasady bezpieczeństwa i zarządzania są ustalane raz i stosowane do wszystkich danych i obciążeń.
  • IDBroker to interfejs API REST zbudowany w ramach usług uwierzytelniania Apache Knox. Umożliwia uwierzytelnionemu i autoryzowanemu użytkownikowi wymianę zestawu danych uwierzytelniających lub tokena na tokeny dostępu dostawcy chmury.

Operacyjna baza danych w serii CDP

W tym artykule przedstawiono wprowadzenie do OpDB na CDP i jego architektury. Możesz dowiedzieć się więcej o każdym aspekcie OpDB oraz dowiedzieć się o nowych funkcjach i możliwościach OpDB w nadchodzących artykułach z tej serii. Będziemy aktualizować linki do każdego wpisu na blogu w miarę jego publikacji.

Ułatwienia dostępu

OpDB firmy Cloudera zapewnia użytkownikom dostęp do przechowywanych danych lub ich pobieranie. Obsługuje zarówno automatyczne, jak i wstępnie zdefiniowane fragmentowanie, trzy silniki zapytań i kilka narzędzi do integracji danych. Ten artykuł zawiera omówienie tych możliwości i innych funkcji, które zapewniają wysoki poziom dostępności.

Administracja

OpDB firmy Cloudera zapewnia kilka narzędzi administracyjnych i funkcji do administrowania obciążeniem OpDB. Administratorzy mogą wdrożyć OpDB jako w pełni bezpieczną, częściowo zarządzaną ofertę w CDP Public Cloud – Data Hub oraz jako w pełni konfigurowalną ofertę w CDP Data Center (podobną do tej, która jest dostępna w CDH i HDP). Ten artykuł zawiera ogólny przegląd funkcji i narzędzi obsługiwanych do administrowania OpDB w CDP.

Zarządzanie

OpDB firmy Cloudera zapewnia narzędzia do zarządzania, które pomagają skutecznie zarządzać obciążeniami OpDB. Ten artykuł zawiera przegląd narzędzi i funkcji zarządzania OpDB w CDP.

Dostępność

OpDB Cloudera utrzymuje wysoki poziom dostępności danych, zapewniając, że wymagane dane są dostępne w razie potrzeby, nawet w przypadku awarii węzła. Ten artykuł zawiera przegląd funkcji, które umożliwiają wysoki poziom dostępności, takich jak standardowa wysoka dostępność, replikacja danych i ochrona przed błędami.

Uczciwość

OpDB Cloudera zapewnia różne możliwości integralności danych, w tym integralność podmiotu i domeny, transakcje ACID i integralność nierelacyjną. Ten artykuł zawiera omówienie możliwości integralności danych OpDB.

Obsługa aplikacji

OpDB Cloudera obsługuje różne popularne języki, frameworki i aplikacje, których możesz użyć, aby uzyskać dostęp do danych przechowywanych w OpDB. Ten artykuł zawiera przegląd obsługiwanych języków, struktur i aplikacji.

NoSQL i powiązane możliwości

Ponieważ OpDB firmy Cloudera zawiera bazę danych NoSQL HBase do przechowywania danych, ma ona możliwości NoSQL, takie jak wartości kluczy, funkcje w stylu tabeli i elastyczne typy danych. Zapewniona jest również ścisła integracja w ekosystemie Hadoop, w tym HDFS, Spark i Kafka. Ten artykuł zawiera omówienie tych możliwości.

Skalowalność

OpDB Cloudera zaprojektowano z myślą o wysokiej skalowalności, obsługując skalowalność zarówno pionową, jak i poziomą, z elastycznym typem danych i bez limitu rozmiaru danych. Ten artykuł zawiera omówienie obsługiwanych funkcji i narzędzi związanych ze skalowalnością.

Bezpieczeństwo

OpDB Cloudera zapewnia wiele rozwiązań bezpieczeństwa na różnych poziomach, w zakresie szyfrowania, uwierzytelniania, autoryzacji i audytu. Ten artykuł zawiera przegląd tych funkcji i narzędzi związanych z bezpieczeństwem.

Aby uzyskać więcej informacji, przejdź do:Pierwsze kroki z operacyjną bazą danych.


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Wykorzystanie inżynierii danych Cloudera do analizy danych programu ochrony wypłat

  2. Indeksowanie wiadomości e-mail za pomocą Cloudera Search i HBase

  3. Kopie zapasowe online Apache HBase z CopyTable

  4. 20 Znacząca różnica między Hadoop 2.x a Hadoop 3.x

  5. Hadoop RecordReader Wstęp, Working &Rodzaje