Nota redaktora, sierpień 2020 r.:CDP Data Center nosi teraz nazwę CDP Private Cloud Base. Więcej informacji na ten temat znajdziesz tutaj.
Operacyjna baza danych Cloudera (OpDB) w CDP dostarcza w czasie rzeczywistym, zawsze dostępną, skalowalną OpDB, która obsługuje tradycyjne dane strukturalne wraz z nowymi danymi niestrukturalnymi w ramach ujednoliconej platformy operacyjnej i magazynowej. Cloudera dostarcza operacyjną bazę danych, która obsługuje tradycyjne ustrukturyzowane dane wraz z nowymi nieustrukturyzowanymi danymi w ramach zunifikowanej platformy open source.
Operacyjna baza danych pomaga:
Operacjonalizacja uczenia maszynowego/sztucznej inteligencji, aby zrewolucjonizować sektory, takie jak opieka zdrowotna, usługi użyteczności publicznej itp.
- Wyświetlaj treści w czasie rzeczywistym w skali internetowej.
- Wspieraj analizy dużych zbiorów danych do zastosowań operacyjnych i offline.
- Używaj jako odpornego magazynu danych.
OpDB w CDP jest obecnie dostępny w dwóch formach:jako w pełni bezpieczna, częściowo zarządzana oferta w CDP Public Cloud – Data Hub oraz jako w pełni konfigurowalna oferta w CDP Data Center – podobna do tej, która jest już dostępna w CDH i HDP. Możesz wybrać współczynnik kształtu w oparciu o strategię wdrażania i potrzeby OpDB. Operacyjna baza danych wykorzystuje składnicę obiektów, taką jak Amazon S3, jako warstwę pamięci dla Apache HBase, gdzie pliki HFiles są zapisywane w składnicy obiektów, ale pliki WAL są zapisywane w systemie HDFS.
Operacyjna baza danych w CDP składa się z następujących komponentów:
- Apache Phoenix to interfejs SQL działający na bazie Apache HBase.
- Apache HBase zaprojektowano z myślą o ogromnej skalowalności, dzięki czemu możesz przechowywać nieograniczone ilości danych na jednej platformie i obsługiwać rosnące wymagania dotyczące udostępniania danych.
- Apache ZooKeeper zapewnia usługę konfiguracji rozproszonej, usługę synchronizacji i rejestr nazw.
- Apache Knox Gateway zapewnia bezpieczeństwo obwodowe, dzięki czemu przedsiębiorstwo może bez obaw rozszerzyć dostęp na nowych użytkowników.
- Apache HDFS jest używany do pisania Apache HBase WALs.
- magazyn obiektów, taki jak Amazon S3 i Microsoft ADLS Gen2, służy do przechowywania Apache HBase HFiles.
- Shared Data Experience (SDX) jest używany do funkcji bezpieczeństwa i zarządzania. Zasady bezpieczeństwa i zarządzania są ustalane raz i stosowane do wszystkich danych i obciążeń.
- IDBroker to interfejs API REST zbudowany w ramach usług uwierzytelniania Apache Knox. Umożliwia uwierzytelnionemu i autoryzowanemu użytkownikowi wymianę zestawu danych uwierzytelniających lub tokena na tokeny dostępu dostawcy chmury.
Operacyjna baza danych w serii CDP
W tym artykule przedstawiono wprowadzenie do OpDB na CDP i jego architektury. Możesz dowiedzieć się więcej o każdym aspekcie OpDB oraz dowiedzieć się o nowych funkcjach i możliwościach OpDB w nadchodzących artykułach z tej serii. Będziemy aktualizować linki do każdego wpisu na blogu w miarę jego publikacji.
Ułatwienia dostępu
OpDB firmy Cloudera zapewnia użytkownikom dostęp do przechowywanych danych lub ich pobieranie. Obsługuje zarówno automatyczne, jak i wstępnie zdefiniowane fragmentowanie, trzy silniki zapytań i kilka narzędzi do integracji danych. Ten artykuł zawiera omówienie tych możliwości i innych funkcji, które zapewniają wysoki poziom dostępności.
Administracja
OpDB firmy Cloudera zapewnia kilka narzędzi administracyjnych i funkcji do administrowania obciążeniem OpDB. Administratorzy mogą wdrożyć OpDB jako w pełni bezpieczną, częściowo zarządzaną ofertę w CDP Public Cloud – Data Hub oraz jako w pełni konfigurowalną ofertę w CDP Data Center (podobną do tej, która jest dostępna w CDH i HDP). Ten artykuł zawiera ogólny przegląd funkcji i narzędzi obsługiwanych do administrowania OpDB w CDP.
Zarządzanie
OpDB firmy Cloudera zapewnia narzędzia do zarządzania, które pomagają skutecznie zarządzać obciążeniami OpDB. Ten artykuł zawiera przegląd narzędzi i funkcji zarządzania OpDB w CDP.
Dostępność
OpDB Cloudera utrzymuje wysoki poziom dostępności danych, zapewniając, że wymagane dane są dostępne w razie potrzeby, nawet w przypadku awarii węzła. Ten artykuł zawiera przegląd funkcji, które umożliwiają wysoki poziom dostępności, takich jak standardowa wysoka dostępność, replikacja danych i ochrona przed błędami.
Uczciwość
OpDB Cloudera zapewnia różne możliwości integralności danych, w tym integralność podmiotu i domeny, transakcje ACID i integralność nierelacyjną. Ten artykuł zawiera omówienie możliwości integralności danych OpDB.
Obsługa aplikacji
OpDB Cloudera obsługuje różne popularne języki, frameworki i aplikacje, których możesz użyć, aby uzyskać dostęp do danych przechowywanych w OpDB. Ten artykuł zawiera przegląd obsługiwanych języków, struktur i aplikacji.
NoSQL i powiązane możliwości
Ponieważ OpDB firmy Cloudera zawiera bazę danych NoSQL HBase do przechowywania danych, ma ona możliwości NoSQL, takie jak wartości kluczy, funkcje w stylu tabeli i elastyczne typy danych. Zapewniona jest również ścisła integracja w ekosystemie Hadoop, w tym HDFS, Spark i Kafka. Ten artykuł zawiera omówienie tych możliwości.
Skalowalność
OpDB Cloudera zaprojektowano z myślą o wysokiej skalowalności, obsługując skalowalność zarówno pionową, jak i poziomą, z elastycznym typem danych i bez limitu rozmiaru danych. Ten artykuł zawiera omówienie obsługiwanych funkcji i narzędzi związanych ze skalowalnością.
Bezpieczeństwo
OpDB Cloudera zapewnia wiele rozwiązań bezpieczeństwa na różnych poziomach, w zakresie szyfrowania, uwierzytelniania, autoryzacji i audytu. Ten artykuł zawiera przegląd tych funkcji i narzędzi związanych z bezpieczeństwem.
Aby uzyskać więcej informacji, przejdź do:Pierwsze kroki z operacyjną bazą danych.