Database
 sql >> Baza danych >  >> RDS >> Database

Samouczek SSIS dla początkujących:Dlaczego, co i jak?

Usługi integracji serwera SQL (SSIS) stanowią integralną część oprogramowania bazy danych Microsoft SQL Server. To znacznie ułatwia zarządzanie danymi dzięki różnym funkcjom. W tym samouczku zagłębimy się w SSIS na poziomie koncepcyjnym, w następującej kolejności:

  • Co to jest integracja danych?
  • Dlaczego SSIS?
  • Co to jest SSIS?
  • Cechy SSIS
  • Jak działa SSIS?
    • Proces ETL
    • Magazynowanie danych
  • Wymagania dotyczące usług integracji programu SQL Server
    • Instalacja SQL Server
    • Zainstaluj narzędzia danych SQL Server
  • Co to jest pakiet SSIS?

Zaczynajmy.

Co to jest integracja danych?

Integracja danych to proces, w którym heterogeniczne dane są pobierane i łączone jako zintegrowana forma i struktura. Na przykład każda firma w dzisiejszych czasach musi przetwarzać duże zestawy danych z różnych źródeł. Dane te muszą zostać przetworzone, aby zapewnić wnikliwe informacje do podejmowania decyzji biznesowych. Tak więc prostym rozwiązaniem byłaby integracja danych. Zasadniczo zintegruje wszystkie dane obecne w różnych bazach danych i połączy je na tej samej platformie.

Oto kilka sposobów na osiągnięcie integracji danych:

Teraz, gdy już zrozumiałeś integrację danych, zobaczmy, dlaczego używane są usługi SSIS. SSIS oznacza SQL Server Integration Services.

Dlaczego SSIS?

  • Dane mogą być ładowane równolegle do wielu różnych miejsc docelowych
  • SSIS eliminuje potrzebę zapalonych programistów
  • Ścisła integracja z innymi produktami Microsoft
  • SSIS jest tańszy niż większość innych narzędzi ETL
  • SIS zapewnia GUI do łatwego przekształcania danych
  • Zbuduj BI w proces transformacji danych
  • Solidna obsługa błędów i zdarzeń

Idąc dalej w tym samouczku SSIS, zobaczmy, co to dokładnie jest i jak działa.

Co to jest SSIS?

SQL Server Integration Services (SSIS) to składnik oprogramowania bazodanowego Microsoft SQL Server, którego można używać do wykonywania szerokiego zakresu zadań związanych z integracją i transformacją danych.

  • Integracja danych: Łączy dane znajdujące się w różnych źródłach i zapewnia użytkownikom ujednolicony widok tych danych
  • Przepływ pracy: Może być również używany do automatyzacji konserwacji baz danych SQL Server i aktualizacji wielowymiarowych danych analitycznych

Funkcje SSIS

Niektóre funkcje korzystania z usług SSIS to:

  • Przekształcenia zorganizowane i wyszukiwania
  • Ścisła integracja z inną rodziną Microsoft SQL
  • Zapewnia bogate środowiska Studio
  • Zapewnia wiele funkcji integracji danych dla lepszych transformacji
  • Szybka łączność danych

Możesz przejrzeć poniższy film, który obejmuje wszystkie podstawy, w tym koncepcje hurtowni danych, które są używane do ekstrakcji danych, transformacji i ładowania (ETL). Jest idealny zarówno dla początkujących, jak i profesjonalistów, którzy chcą odświeżyć swoje podstawy MSBI.

Idąc dalej w samouczku SSIS, zobaczmy, jak dokładnie to działa.

Jak działa SSIS?

SSIS składa się z trzech głównych komponentów, a mianowicie:

  • Dane operacyjne
  • Proces ETL
  • Hurtownia danych

Te zadania związane z transformacją danych i tworzeniem przepływów pracy są wykonywane za pomocą „Pakietu SSIS”, który zostanie omówiony w dalszej części tego bloga. Kontynuując samouczek SSIS, najpierw przyjrzyjmy się szczegółowo każdemu z tych komponentów:

Dane operacyjne

Operacyjna składnica danych (ODS) to baza danych zaprojektowana do integracji danych z wielu źródeł w celu wykonania dodatkowych operacji na danych. Jest to miejsce, w którym większość danych wykorzystywanych w bieżącej operacji jest przechowywana przed przesłaniem ich do hurtowni danych w celu długoterminowego przechowywania lub archiwizacji.

Proces ETL

ETL to proces wyodrębniania, przekształcania i ładowania danych. Wyodrębnij, przekształć i załaduj (ETL) to proces wyodrębniania danych z różnych źródeł, przekształcania tych danych w celu spełnienia wymagań, a następnie ładowania do docelowej hurtowni danych. Firma ETL zapewnia ROZWIĄZANIE JEDNORAZOWEGO rozwiązania dla wszystkich tych problemów.

  • Wyodrębnij
  • Przekształć
  • Załaduj

Wyciąg: Ekstrakcja to proces wyodrębniania danych z różnych jednorodnych lub heterogenicznych źródeł danych w oparciu o różne punkty walidacji.

Przekształcenie: Podczas transformacji całe dane są analizowane i stosowane są na nich różne funkcje w celu załadowania danych do docelowej bazy danych w uporządkowanym i ogólnym formacie.

Załaduj: Ładowanie to proces ładowania przetworzonych danych do docelowego repozytorium danych przy użyciu minimalnych zasobów.


Magazynowanie danych

  • Datawarehouse przechwytuje dane z różnych źródeł w celu przydatnej analizy i dostępu.
  • hurtownia danych to duży zestaw zgromadzonych danych, który służy do gromadzenia i zarządzania danymi z różnych źródeł w celu odpowiedzi na pytania biznesowe. Dlatego pomaga w podejmowaniu decyzji.

Wymagania dotyczące usług integracji serwera SQL

Aby pracować z usługami SSIS, musisz zainstalować następujące elementy:

  • Serwer SQL
  • Narzędzia danych serwera SQL

Przyjrzyjmy się procesowi instalacji.

Instalacja serwera SQL

Przejdź do witryny:https://www.microsoft.com/en-au/sql-server/sql-server-downloads, aby zainstalować SQL Server. Możesz zainstalować najnowszą lub poprzednią wersję zgodnie z własnym wyborem.

Istnieją więc różne edycje SQL Server, a mianowicie:

    • Bezpłatna wersja próbna: Otrzymujesz 180-dniową bezpłatną wersję próbną SQL Server 2017 w systemie Windows.
    • Wersja dla programistów: Jest to w pełni funkcjonalna darmowa edycja, licencjonowana do użytku jako baza danych programistycznych i testowych w środowisku nieprodukcyjnym.
    • Wydanie ekspresowe: Express to bezpłatna wersja SQL Server, idealna do programowania i produkcji aplikacji komputerowych, internetowych i małych aplikacji serwerowych.

W następnej kolejności zobaczmy, jak zainstalować narzędzia danych.

Narzędzia danych SQL Server

Przejdź do witryny:https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server -ver15 i zapoznaj się z różnymi wydaniami dostarczonymi przez firmę Microsoft. Zapoznaj się z poniższym zrzutem ekranu z najnowszą wersją SSDT wraz z linkiem do pobrania.

W tym samouczku zainstaluję wersję 15.9.1. Więc zacznijmy.

Krok 1: Po otwarciu pliku .exe zostaniesz poproszony o ponowne uruchomienie systemu przed instalacją.

Krok 2: Po ponownym uruchomieniu systemu wszystko gotowe. Wystarczy kliknąć przycisk „Dalej” i postępować zgodnie z instrukcjami wyświetlanymi na ekranie.

Krok 3: Pokaże wymagane narzędzia i funkcje, takie jak baza danych SQL Server, SSAS, SSRS i SSIS. Upewnij się, że zaznaczyłeś je wszystkie i kliknij przycisk „zainstaluj”. Zobacz poniższy zrzut ekranu, aby zobaczyć to samo.

Następnie w samouczku SSIS omówimy pakiet SSIS i sposób, w jaki można go utworzyć za pomocą powyższych narzędzi.

Co to jest pakiet SSIS?

Pakiet jest podstawowym blokiem, w którym możesz iść dalej i kodować w SSIS. Teraz „kod” nie odnosi się do żadnego języka programowania, to rozwój, który robisz. Więc zasadniczo twój rozwój odbywa się w pakiecie. Jak omówiono powyżej, SSIS jest niezbędny dla ETL, a pakiet SSIS wykona proces ETL. Dlatego jest to obiekt, który implementuje funkcjonalność Integration Services do wyodrębniania, przekształcania i ładowania danych . Pakiet składa się z:

  • Połączenia
  • Kontroluj elementy przepływu
  • Elementy przepływu danych

To wszystko w tym samouczku SSIS. Mam nadzieję, że podobało Ci się to czytanie.

To prowadzi nas do końca tego bloga. Mam nadzieję, że spodobał Ci się ten samouczek dotyczący usługi Power BI. Był to pierwszy blog z serii Power BI. Po tym samouczku dotyczącym usługi Power BI pojawi się mój następny blog, który skupi się na pulpitach nawigacyjnych usługi Power BI, również to przeczytaj.

Jeśli chcesz nauczyć się SSIS i zbudować karierę w wizualizacji danych lub BI, sprawdź naszą certyfikat szkolenia MSBI który jest dostarczany z prowadzonym przez instruktora szkoleniem na żywo i doświadczeniem w rzeczywistych projektach. To szkolenie pomoże ci dogłębnie zrozumieć MSBI i pomoże ci osiągnąć mistrzostwo w tym temacie.

Masz do nas pytanie? Wspomnij o tym w sekcji komentarzy „Samouczka SSIS”, a my skontaktujemy się z Tobą.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Natychmiastowa inicjalizacja pliku:wpływ podczas instalacji

  2. Konstruowanie modelu danych dla systemu zarządzania parkingami

  3. Aspekty ciągów w .NET

  4. Maskowanie danych w aplikacjach DB

  5. Podejście do strojenia indeksów – część 1