HBase
 sql >> Baza danych >  >> NoSQL >> HBase

Apache Phoenix dla CDH

Apache Phoenix dla CDH:najlepsza nowa funkcja dla DBMS

Cloudera przyjmuje i będzie wspierać Apache Phoenix dla CDH, jednocześnie integrując go ze swoją Cloudera Data Platform.

Wersje CDH firmy Cloudera obejmują Apache HBase, który zapewnia odporny system DBMS NoSQL dla klientów aplikacji operacyjnych, którzy chcą wykorzystać moc big data. Aplikacje te urosły do ​​rangi aplikacji ważnych i krytycznych, które zapewniają najwyższe przychody i rentowność. Aplikacje te obejmują aplikacje skierowane do klientów, platformy e-commerce, wykrywanie ryzyka i oszustw stosowane za kulisami w bankach lub obsługujące modele AI/ML dla aplikacji i umożliwiające dalsze szkolenie wzmacniające w oparciu o rzeczywiste wyniki.

Jednak dla wielu klientów HBase był zbyt zniechęcającą podróżą — wymagającą od nich nauki

  • Nowy model danych jako HBase to schemat szerokiej tabeli obsługujący miliony kolumn, ale bez złączeń i
  • Korzystanie z API Java zamiast ANSI SQL

Poprosili o możliwość korzystania z bardziej tradycyjnego projektu schematu, który przypomina ten dostarczony przez Oracle lub MySQL i byli gotowi poczynić pewne kompromisy w zakresie elastyczności, np.

  • Chcą używać dostarczonych typów danych zamiast definiować własne
  • Są gotowi zrezygnować z elastyczności, aby pojedyncza kolumna miała wiele typów w zależności od wiersza w zamian za jeden typ w jednym wierszu

Aby umożliwić klientom łatwe przejście do innych korzyści Apache HBase (nieograniczone skalowanie w poziomie, miliony wierszy, ewolucja schematu itp.) przy jednoczesnym zapewnieniu możliwości podobnych do RDBMS (ANSI SQL, proste złączenia, typy danych z box itp.), wprowadzamy obsługę Apache Phoenix na CDH.

Dla wszystkich innych aplikacje oparte na Phoenix również korzystają z zakulisowych optymalizacji HBase, co ułatwia uzyskanie lepszej wydajności HBase. Na przykład Phoenix implementuje solenie kluczy podstawowych — dzięki czemu użytkownicy HBase nie muszą zastanawiać się nad tym aspektem projektowania kluczy.

Co więcej, aplikacje oparte na Phoenix mogą współistnieć z aplikacjami HBase — co oznacza, że ​​możesz użyć jednego klastra HBase do obsługi obu. Dzięki Phoenix klienci mogą nadal korzystać ze swoich ulubionych narzędzi BI i dashboardów, tak jak robili to w przeszłości z Hive &Impala. Korzystając z Phoenix, mogą również zdecydować się na bezpośrednie użycie Phoenix z tymi narzędziami, oprócz opcji korzystania z Hive / Impala, eliminując krok w kierunku nowych implementacji.

Z perspektywy bezpieczeństwa i zarządzania (SDX) w CDH Phoenix używa list ACL HBase do kontroli dostępu opartej na rolach dla tabel Phoenix. Phoenix wykorzystuje również integrację HBase z Cloudera Navigator w celu uzyskania informacji audytowych.

Cloudera wydała paczkę Phoenix 4.14.1 dostępną dla klientów CDH 5.16.2 i paczkę Phoenix 5.0 dostępną dla klientów CDH 6.2+.

Obecni klienci HDP mają już wsparcie Apache Phoenix, a prawie połowa użytkowników HBase korzystających z HDP korzysta obecnie z Phoenix, a także mówiąc o jego popularności w społeczności użytkowników HBase.

Pobierz Apache Phoenix dla CDH

Twórz aplikacje o znaczeniu krytycznym za pomocą Apache Phoenix. Pobierz oprogramowanie tutaj.

Często zadawane pytania dotyczące Phoenix

P) Do jakich obciążeń należy używać oprogramowania Phoenix

Phoenix obsługuje te same przypadki użycia, co HBase, głównie obciążenia o niskim opóźnieniu i wysokiej współbieżności. Jednak Phoenix ułatwia również wykorzystanie bazowych danych do celów pulpitu nawigacyjnego i BI

P) Jaki jest mechanizm autoryzacji w Phoenix?

Phoenix zależy od HBase do autoryzacji. W przypadku klientów CDH wykorzystuje to listy ACL HBase. W przypadku klientów HDP odbywa się to poprzez integrację HBase-Ranger

P)  Jaka jest skalowalność Phoenix? Jaki jest największy znany klaster?

Phoenix skaluje się do setek TB danych. Największy klient ma ponad 0,5 PB danych, którymi zarządza Phoenix. Szczegółowe informacje na temat przypadków użycia można znaleźć w archiwach PhoenixCon oraz w archiwach filmów z dnia NoSQL na początku tego roku we własnych słowach i slajdach użytkowników.

P) Czy oprogramowanie Phoenix obsługuje drugorzędne indeksowanie geograficzne? Jaki poziom obsługi danych przestrzennych?

Ma ograniczone wsparcie dla danych geoprzestrzennych. Jednak GeoMesa zapewnia warstwę geoprzestrzenną w HBase, która może zaspokoić tę potrzebę i zintegrować się z aplikacjami klienta. Phoenix, GeoMesa, JanusGraph i OpenTSDB mogą współistnieć w jednym klastrze HBase.

P) Jak tworzysz i używasz indeksu?

Szczegółowe informacje na temat indeksowania można znaleźć na stronie Phoenix Secondary Indexing. Od wersji Phoenix 4.8.0 do korzystania z lokalnego indeksowania nie są wymagane żadne zmiany konfiguracji.

P)  Czy istnieje limit liczby kolumn, które można umieścić w indeksie?

Podobnie jak w RDBMS, indeks jest zasadniczo oddzielną tabelą z indeksem i łączem do danych źródłowych. Jeśli zindeksujesz wszystkie kolumny, pominiesz cel, utrzymując dwie identyczne tabele. Indeksy powinny być używane rozważnie, ponieważ przy zapisie (indeksy globalne) lub odczycie (indeksy lokalne) występuje pewien nietrywialny narzut.


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Co to jest klasa Hadoop Mapper w MapReduce?

  2. Instrukcje:dołączanie bibliotek innych firm do zadania MapReduce

  3. Istotne cechy MapReduce – znaczenie MapReduce

  4. Świadomość szafy w Hadoop i jej zalety

  5. Porównanie Apache HBase z Apache Cassandra na SSD w środowisku chmury