Cloudera Data Platform (CDP) Data Center to całkowicie platforma danych, która łączy najnowsze rozwiązania analityczne typu open source — Spark, Impala, Hive, HBase, Kafka, Hadoop i inne — w wielofunkcyjny system analizy i zarządzania danymi, który oferuje:
- Wyższa wydajność analizy SQL
- Przetwarzanie i zarządzanie strumieniem w czasie rzeczywistym
- Szczegółowa kontrola dostępu oparta na atrybutach
- Dynamiczne filtrowanie kolumn i maskowanie wierszy
- 10-krotny wzrost skalowalności plików i obiektów
Użyłem modułu Terraform (v0.12), który wdraża CDP Data Center na Oracle Cloud Infrastructure (OCI).
Ten szablon obsługuje docelowe istniejące sieci VCN/podsieci do wdrożenia klastra. Aby skorzystać z tej funkcji, po prostu użyj systemu menu schematu, aby wybrać istniejący cel VCN, a następnie wybierz odpowiednie podsieci dla każdego typu hosta klastra.
1. Pobierz plik zip do wdrożenia Cloudera Terraform za pomocą Menedżera zasobów .
2. Zaloguj się do Oracle Cloud Infrastructure (OCI)
3. Wybierz Menedżer zasobów i kliknij Stosy
4. Kliknij Utwórz stos .
5. Na Informacjach o stosie prześlij plik zip pobrany w kroku 1, a następnie kliknij Dalej .
6. Na Konfiguruj zmienne strony, wprowadź zawartość „klucza dostarczonego przez SSH” (opcjonalnie). Uwaga:jeśli wdrożysz Cloudera Manager w prywatnej podsieci, będziesz potrzebować tunelu VPN lub SSH przez węzeł brzegowy aby uzyskać dostęp do zarządzania klastrami. Tworząc VPC, musisz określić zakres adresów IPv4 dla VPC w postaci bloku bezklasowego routingu międzydomenowego (CIDR), na przykład 10.0.0.0/16. Kliknij Dalej .
7. Sprawdź konfigurację i kliknij Utwórz.
9. Z Działań Terraform menu wybierz Plan
10. Kliknij Plan
11. Poczekaj chwilę na zakończenie tej pracy.
12. Terraform został pomyślnie zainicjowany.
13. Praca zakończona pomyślnie
14. Diagram przedstawiający, co jest zwykle wdrażane przy użyciu tego szablonu. Zasoby są automatycznie rozdzielane między „Domeny błędów” w „Domenach dostępności”, aby zapewnić odporność na błędy.
Referencje
Dowiedz się więcej o wdrażaniu usługi Hadoop w Oracle Cloud Infrastructure. Dostępne pod adresem https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B
Łatwe wdrażanie Hadoop w Oracle Cloud Infrastructure za pomocą Menedżera zasobów. Dostępne pod adresem https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager
Cloudera na Oracle Cloud Infrastructure (szablon wdrożenia Terraform). Dostępne na https://github.com/oracle-quickstart/oci-cloudera
Przegląd Menedżera zasobów. Dostępne pod adresem https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm
Centrum danych CDP. Dostępne pod adresem https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html