Wprowadzenie
Narzędzia Pentaho Data Integration i BA Server zawierają wiele różnych sterowników baz danych. Jednak od wersji 7 Community Edition nie są dostarczane ze sterownikami JDBC dla Oracle, SQL Server lub MySQL (w narzędziach Data Integration). Poniższe kroki opisują, jak dodać sterowniki MySQL JDBC do Pentaho.
Postępuj zgodnie z tymi instrukcjami dotyczącymi instalacji serwera Pentaho BA i narzędzi do integracji danych, jeśli narzędzia nie zostały jeszcze zainstalowane. Po zainstalowaniu narzędzi Pentaho wyłącz serwer BA i oprogramowanie do integracji danych.
Uzyskiwanie sterowników MYSQL JDBC
Sterowniki JDBC dla MySQL nazywają się „Złącze/J”
Odwiedź:https://dev.mysql.com/downloads/connector/j/
Przewiń w dół do sekcji z opcjami pobierania.
Upewnij się, że wybrano opcję „Niezależne od platformy”
W przypadku systemu operacyjnego Windows pobierz archiwum ZIP
Zaloguj się na swoje konto w witrynie internetowej Oracle (lub utwórz je za darmo). Lub kliknij Po prostu rozpocznij pobieranie link.
Zapisz plik ZIP w folderze:
Rozpakuj (rozpakuj) archiwum ZIP:
Instrukcje kopiowania sterowników JDBC do odpowiednich folderów w narzędziach Pentaho są opisane na następnej stronie.
Należy pamiętać, że od listopada 2019 r. narzędzia Pentaho w wersji 8.x nie będą działać bezpośrednio z nowszymi sterownikami MySQL Connector w wersji 8.x. Najłatwiejszym rozwiązaniem jest użycie sterowników MySQL 5.x Connector. Obejściem tego problemu jest użycie sterowników MySQL w wersji 8.x, ale użycie połączenia ogólnego. Trochę dyskusji można znaleźć pod tym linkiem. Kolejną wskazówką jest zainstalowanie wtyczki PDI MySql z Pentaho Marketplace w Pentaho Data Integration.
Kopiowanie plików sterownika JDBC do folderów Pentaho BA Server i Data Integration Lib
Znajdź plik mysql-connector-java-5.1.41-bin.jar (zwróć uwagę, że może on mieć nieco inną nazwę w zależności od wersji).
Skopiuj ten plik .jar do odpowiedniego folderu LIB w dystrybucji Pentaho Community Edition.
W przypadku integracji danych Pentaho folder docelowy powinien być .\Pentaho\data-integration\lib, jak pokazano poniżej:
Serwer Pentaho BA przechowuje swoje sterowniki w folderze .\pentaho-server\tomcat\lib. Upewnij się, że sterownik MySQL JDBC nie jest jeszcze zainstalowany. Jeśli tak, zachowaj tylko najnowszą kopię pliku .jar. Na przykład wersja 7.0 Pentaho Server zawiera wersję sterownika MySQL JDBC mysql-connector-java-5.1.17. Jednak ta wersja ma kilka błędów, więc pamiętaj, aby usunąć ten plik mysql-connector-java-5.1.17.jar i zastąpić go najnowszym plikiem mysql-connector-java-5.1.41-bin.jar.
Teraz, gdy sterowniki JDBC zostały skopiowane do odpowiednich folderów, uruchom ponownie Pentaho BA Server (start-pentaho) i uruchom narzędzia Data Integration (Spoon). Instrukcje dotyczące tworzenia połączenia z bazą danych w narzędziach Pentaho Data Integration Tools znajdują się na następnej stronie.
Konfigurowanie połączenia MySQL w Pentaho Data Integration
Wykonaj ten zestaw kroków, aby utworzyć nowe połączenie bazy danych z MySQL za pomocą narzędzi Pentaho Data Integration. W Pentaho Data Integration wiele etapów transformacji wysyła dane do tabeli bazy danych. Kilka przykładów można znaleźć w tym samouczku dotyczącym integracji danych Pentaho.
Przed rozpoczęciem będziesz potrzebować danych logowania do instancji MySQL. Możesz odwiedzić mój samouczek dotyczący konfigurowania bezpłatnej instancji MySQL na GearHost lub ten samouczek dotyczący instalowania MySQL w systemie Windows.
W Integracji danych Pentaho wybierz dowolny krok transformacji, który wykorzystuje bazę danych jako dane wyjściowe, na przykład etap wyszukiwania/aktualizacji wymiarów, wstawiania/aktualizacji lub danych wyjściowych tabeli. Kliknij Nowy przycisk obok nazwy połączenia, aby wyświetlić okno dialogowe Połączenie z bazą danych, jak pokazano poniżej.
Podaj nazwę połączenia, a następnie wybierz MySQL jako typ połączenia.
Podaj Nazwę hosta serwera z uruchomionym MySQL. Jeśli masz zainstalowany MySQL na lokalnym komputerze lub serwerze, użyj localhost jako Nazwy hosta . Podaj Nazwę bazy danych i użyj domyślnego numeru portu z 3306. Na koniec podaj bazę danych MySQL Nazwa użytkownika i Hasło .
Kliknij Test przycisk, aby upewnić się, że połączenie z bazą danych działa prawidłowo.
Jeśli pojawi się następujący błąd, upewnij się, że plik .jar sterownika MySQL JDBC został skopiowany do Pentaho Data Integration lib folder (jak omówiono na poprzedniej stronie tego samouczka). Wyjdź z narzędzia do integracji danych i uruchom je ponownie.
Błąd podczas łączenia z bazą danych [MySQLConnetion]:org.pentaho.di.core.exception.KettleDatabaseException:Wystąpił błąd podczas próby połączenia z klasą sterownika bazy danych „org.gjt.mm.mysql.Driver”. upewnij się, że sterownik 'MySQL' (plik jar) jest zainstalowany.
Należy pamiętać, że od listopada 2019 r. narzędzia Pentaho w wersji 8.x nie będą działać bezpośrednio z nowszymi sterownikami MySQL Connector w wersji 8.x. Najłatwiejszym rozwiązaniem jest użycie sterowników MySQL 5.x Connector. Obejściem tego problemu jest użycie sterowników MySQL w wersji 8.x, ale użycie połączenia ogólnego. Trochę dyskusji można znaleźć pod tym linkiem. Kolejną wskazówką jest zainstalowanie wtyczki PDI MySql z Pentaho Marketplace w Pentaho Data Integration.
Pamiętaj, aby ustawić Schemat docelowy w dowolnych danych wyjściowych bazy danych lub krokach wyszukiwania wymiarów. W MySQL schemat można pozostawić pusty, aby użyć domyślnej bazy danych MySQL.
Jeśli ćwiczyłeś przeprowadzanie transformacji względem bazy danych H2 jako celu, używałeś do tego, aby PUBLIC był schematem docelowym. w przypadku MySQL po prostu pozostaw docelowy schemat pusty, aby został użyty domyślny.
Na następnej stronie opisano, jak skonfigurować nowe połączenie z bazą danych i źródło danych Mondrian na serwerze Pentaho BA.
Konfigurowanie źródła danych MySQL na serwerze Pentaho BA
Na stronie głównej konsoli użytkownika Pentaho kliknij Zarządzaj źródłami danych , aby wyświetlić ekran Zarządzaj źródłami danych. Pierwszym krokiem od tego momentu będzie utworzenie nowego połączenia bazy danych z bazą danych MySQL.
Kliknij ikonę koła zębatego, aby otworzyć menu, a następnie kliknij Nowe połączenie… pozycja menu, jak pokazano poniżej.
Podaj nazwę nowego połączenia z bazą danych. Wybierz MySQL jako Typ bazy danych a następnie kliknij opcję Natywna (JDBC) pod Dostęp: nagłówek. Wpisz Nazwę hosta , Nazwa bazy danych , Numer portu , Nazwa użytkownika i Hasło dla Twojej bazy danych MySQL. Jeśli MySQL jest zainstalowany na lokalnym komputerze lub serwerze, użyj localhost jako Nazwy hosta .
Po zakończeniu kliknij niebieski Test przycisk, aby przetestować połączenie z bazą danych
Jeśli są jakieś błędy, sprawdź informacje o połączeniu (nazwę hosta, nazwę użytkownika, hasło itp.), a następnie powtórz test.
Jeśli pojawi się błąd dotyczący połączeń SSL (połączenie może zostać przerwane po kilku minutach), dodaj parametr useSSL z wartością false, jak pokazano poniżej.
Po zakończeniu kliknij OK aby zapisać nowe połączenie z bazą danych. Nowe połączenie z bazą danych powinno teraz pojawić się na liście:
Teraz, gdy połączenie zostało utworzone i przetestowane, można utworzyć źródło danych Mondrian. Te instrukcje znajdują się na następnej stronie.
Tworzenie nowego źródła danych na serwerze Pentaho BA
W Pentaho BA Server źródło danych reprezentuje schemat wielowymiarowej bazy danych Mondrian, który znajduje się na szczycie wielowymiarowego magazynu danych lub relacyjnej bazy danych. Źródło danych wymaga połączenia z podstawową bazą danych i zbudowania na nim modelu danych Mondrian. Model danych Mondrian składa się z wymiarów i miar. Wymiary zawierają pola ułożone w hierarchii. Możliwe jest posiadanie kilku różnych modeli danych, które są budowane na tym samym bazowym źródle danych.
Aby rozpocząć tworzenie nowego źródła danych, kliknij niebieski Nowe źródło danych przycisk. Uruchomi się Kreator źródła danych.
Wpisz nową nazwę Źródła danych i wybierz Połączenie z bazą danych . Wybierz tabele bazy danych jako Źródło Rodzaj. W tym przykładzie będziemy pracować ze schematem gwiazdy, więc wybieramy opcję Raportowanie i analiza .
Kliknij Dalej przycisk i serwer Pentaho BA zapyta schemat bazowej bazy danych dla połączenia z bazą danych
Następny ekran kreatora przedstawi listę tabel, które zostały znalezione w schemacie z połączenia z bazą danych.
Kliknij jedną z Dostępnych tabel a następnie kliknij przycisk strzałki w prawo, aby przenieść go do Wybranych tabel strona. Powtórz to dla każdej tabeli, która zostanie uwzględniona w źródle danych.
Ponieważ w tym przykładzie użyto opcji „Raportowanie i analiza”, jedną z tabel bazy danych należy wybrać jako Tabela faktów . Po wprowadzeniu tych zmian kliknij Dalej przycisk, aby przejść do ostatniego kroku definiowania złączeń.
Uwaga:Jeśli nie pojawiają się żadne klucze obce, upewnij się, że pracujesz z najnowszym sterownikiem MySQL JDBC, ponieważ naprawia on kilka błędów. mysql-connector-java-5.1.17 to starsza wersja dostarczana z Pentaho Server 7.0. Jeśli aktualizujesz sterownik JDBC, pamiętaj o ponownym uruchomieniu serwera Pentaho BA.
Dla każdej pary tabel kliknij Pole kluczowe w lewej tabeli i powiązane pole kluczowe w prawej tabeli. Następnie kliknij Utwórz dołączenie połączyć. W poniższym przykładzie utworzono połączenie między tabelą sales_fact, a następnie tabelą customer_dim przy użyciu wspólnego klucza customer_dim_id.
Powtórz to dla każdej pary kluczy. W tym przykładzie jest jedna tabela faktów i 5 tabel wymiarów, co skutkuje utworzeniem 5 złączeń. Jeśli popełnisz błąd, zaznacz dołączenie i kliknij Usuń dołączenie link.
Po zakończeniu kliknij Zakończ przycisk.
Kliknij OK przycisk, aby powrócić do Zarządzaj źródłami danych ekran.
Utworzono teraz nowe źródło danych z domyślnym modelem danych. Jednak ten model danych będzie wymagał pewnej edycji. Instrukcje dotyczące edycji modelu danych Mondriana znajdują się na następnej stronie.
Edytuj model danych Mondriana, aby zdefiniować wymiary i miary
Zaznacz Źródło danych, rozwiń ikonę koła zębatego i wybierz Edytuj . Spowoduje to otwarcie Edytora modelu źródła danych . Domyślny model kopiuje wszystkie kolumny ze schematu jako Wymiary i Miary. Jednak ten domyślny model prawdopodobnie nie będzie działał, ponieważ hierarchie nie zostały jeszcze zdefiniowane.
Usuwanie istniejącego modelu danych
Kliknij przycisk pokazany poniżej, aby Wyczyść aktualny model.
Po wyświetleniu monitu o potwierdzenie kliknij Tak aby wyczyścić model
Model zostanie teraz wyczyszczony, a miary i wymiary pokażą ostrzeżenie, ponieważ nie ma zawartości.
Tworzenie nowej miary
Utwórz nową miarę, przeciągając i upuszczając Fakt sprzedaży z Dostępnych obok Środków wpis pod Analiza zakładka.
Usuń każdy z identyfikatorów wymiaru i ORDER ID z miar, ponieważ tak naprawdę nie są to miary (są kluczami obcymi). Kliknij Identyfikator klienta, a następnie kliknij niebieski X aby go usunąć. Powtórz dla identyfikatorów drugiego wymiaru.
Tworzenie wymiaru KLIENT
Po wprowadzeniu miar można tworzyć wymiary. Kliknij Wymiary wpis, a następnie kliknij Dodaj wymiar przycisk, jak pokazano poniżej.
Nazwij ten nowy wymiar KLIENT (nie zapomnij użyć nazw innych niż liczba mnoga) i kliknij OK przycisk.
KLIENT wymiar zostanie utworzony z pod nim Hierarchią KLIENTA:
Otwórz przyciemnianie klienta w panelu Dostępne. Przeciągnij pole COUNTRY_NAME i upuść je na Hierarchię KLIENTA jak pokazano niżej. Umieszczenie tego we właściwym miejscu może zająć kilka prób.
Wynik pokaże NAZWA KRAJU pojawiająca się w hierarchii KLIENTA.
Powtórz powyższe kroki, aby dodać STATE_PROVINCE i CITY do hierarchii CUSTOMER. Dla każdego pola w hierarchii KLIENTA zmień typ Geografia, aby był zgodny. Na przykład COUNTRY_NAME powinno mieć typ geograficzny „Kraj”, a STATE_PROVINCE powinien mieć typ geograficzny „Stan”.
Tworzenie wymiaru daty
Kliknij wpis DIMENSIONS, a następnie kliknij Dodaj wymiar przycisk. Nazwij nowy wymiar DATE. Kliknij nazwę wymiaru DATE i zaznacz pole „Wymiar czasu”:
Przeciągnij i upuść rok sprzedaży, kwartał sprzedaży, nazwę miesiąca sprzedaży, dzień sprzedaży roku i datę sprzedaży do DATY
Hierarchia . Dla każdego pola wybierz odpowiedni Typ poziomu czasu i Format kolumny źródłowej .
Wypełniony wymiar DATE powinien wyglądać tak:
Tworzenie wymiaru PRODUKTU
Kliknij Wymiary wpis, a następnie kliknij Dodaj wymiar przycisk. Nazwij nowy wymiar PRODUKT. Przeciągnij i upuść CATEGORY_NAME, SUB_CATEGORY_NAME i PRODUCT_NAME w Hierarchii PRODUCT .
Kliknij OK przycisk, aby zamknąć Edytor modelu źródła danych.
Wyloguj się z konsoli użytkownika Pentaho, wyłącz serwer Pentaho za pomocą skryptu stop-pentaho, a następnie uruchom ponownie serwer Pentaho.
Po utworzeniu modelu danych Mondrian nowe źródło danych jest gotowe do użycia do tworzenia wizualizacji na pulpicie nawigacyjnym lub do celów raportowania.
Tworzenie prostego wykresu za pomocą Kreatora wykresów OLAP
Utwórz nowy panel (lub edytuj istniejący panel) i użyj kreatora OLAP, aby utworzyć nowy wykres
Poniżej znajduje się zapytanie MDX, które jest automatycznie generowane przez Kreatora OLAP: