Dla porównania, Power BI to oprogramowanie do wizualizacji i analizy danych opracowane przez firmę Microsoft. Usługa Power BI może służyć zarówno do statycznej, jak i interaktywnej wizualizacji danych. Zanim będziesz mógł tworzyć rzeczywiste wizualizacje za pomocą usługi Power BI, możesz wykonać wstępne przetwarzanie danych za pomocą edytora Power BI Query.
Za pomocą edytora zapytań możesz wykonywać różne zadania transformacji danych, takie jak zmiana typów kolumn, obsługa brakujących wartości, usuwanie wierszy i kolumn, przestawianie i odwracanie kolumn, dzielenie kolumn itp.
W tym artykule dowiesz się, jak przestawiać, przestawiać i dzielić kolumny za pomocą edytora Power BI Query.
Importowanie zbioru danych do edytora zapytań
Zestaw danych użyty jako przykład w tym artykule jest w formacie pliku CSV, który można pobrać za pomocą tego linku kaggle. Pobierz plik CSV do lokalnego systemu plików.
Następnie otwórz program Power BI Desktop, kliknij przycisk „Pobierz dane” z górnego menu. Z listy rozwijanej wybierz „Tekst/CSV”, jak pokazano poniżej.
Zaimportowanie danych do usługi Power BI zajmie trochę czasu. Po załadowaniu danych powinieneś zobaczyć poniższe okno.
Zestaw danych zawiera informacje o populacji, obszarze, współczynniku urodzeń, współczynniku zgonów, gęstości zaludnienia, PKB na mieszkańca, telefonach na 1000 itp. dla wszystkich krajów na świecie. Aby załadować dane do edytora zapytań, kliknij przycisk „Przekształć dane”.
Edytor zapytań wygląda tak:
W edytorze zapytań możesz wykonywać różne operacje wstępne, takie jak obracanie, przestawianie i dzielenie kolumn.
Teoria przechylania i przechylania
Zanim przejdziemy do przestawiania i przestawiania kolumn za pomocą edytora zapytań usługi Power BI. Rozważmy bardzo prosty przykład unpivotingu.
Wycofanie
Załóżmy, że masz zestaw danych, który zawiera następujące informacje. Wiersze w poniższej tabeli odpowiadają krajom, natomiast kolumny zawierają w wierszach informacje o PKB na mieszkańca i współczynniku alfabetyzacji dla odpowiednich krajów. (Uwaga:są to tylko wartości pozorne, a nie rzeczywiste)
Kraj | PKB na mieszkańca | Wskaźnik umiejętności czytania i pisania |
Francja | 30 000 | 95% |
Niemcy | 25 000 | 96% |
Jeśli przestawisz pojedynczą kolumnę, np. PKB na mieszkańca, zestaw danych z kolumną nieobrotową będzie wyglądał tak.
Kraj | Atrybut | Wartość | Umiejętność czytania i pisania |
Francja | PKB na mieszkańca | 30 000 | 95% |
Niemcy | PKB na mieszkańca | 25 000 | 96% |
Widać, że kolumna PKB na mieszkańca została zastąpiona dwiema kolumnami, tj. Atrybut i Wartość. Wartości w kolumnie „Atrybut” odpowiadają nazwie kolumny, która nie jest przestawna, podczas gdy kolumna „Wartość” zawiera wartości, które wcześniej istniały w kolumnie nieprzestawnej. Ponieważ tylko jedna kolumna nie jest przestawna, wartości w kolumnie „Atrybut” będą zawsze takie same. Ponadto liczba wierszy w zbiorze danych z jedną nieprzestawną kolumną pozostanie taka sama.
Spróbujmy teraz zobaczyć, co się stanie, gdy przestawimy dwie kolumny. Odwrócimy obie kolumny PKB na mieszkańca i Wskaźnik umiejętności czytania i pisania w oryginalnym zestawie danych. Zestaw danych z dwiema kolumnami nieprzestawnymi wygląda tak.
Kraj | Atrybut | Wartość |
Francja | PKB na mieszkańca | 30 000 |
Francja | Wskaźnik umiejętności czytania i pisania | 95% |
Niemcy | PKB na mieszkańca | 25 000 |
Niemcy | Wskaźnik umiejętności czytania i pisania | 96% |
W powyższym zestawie danych widać, że dla każdej nazwy kraju kolumna „Atrybut” zawiera teraz dwie unikalne wartości:PKB na mieszkańca i wskaźnik alfabetyzacji. Kolumna „Wartość” zawiera odpowiednie wartości dla Atrybutów. Zauważ, że liczba wierszy podwoiła się. Podobnie, jeśli przestawisz trzy kolumny, liczba wierszy w zestawie danych wzrośnie trzykrotnie.
Obracanie
Obracanie, jak sama nazwa wskazuje, odnosi się do procesu, który jest używany do odwrócenia nieprzestawionego zestawu danych do jego pierwotnej postaci. Na przykład podczas obracania tabela wejściowa wygląda tak:
Kraj | Atrybut | Wartość |
Francja | PKB na mieszkańca | 30 000 |
Francja | Wskaźnik umiejętności czytania i pisania | 95% |
Niemcy | PKB na mieszkańca | 25 000 |
Niemcy | Wskaźnik umiejętności czytania i pisania | 96% |
Po zastosowaniu przestawiania w kolumnach „Atrybut” i „Wartość” zbiór danych przyjmuje następującą postać:
Kraj | PKB na mieszkańca | Wskaźnik umiejętności czytania i pisania |
Francja | 30 000 | 95% |
Niemcy | 25 000 | 96% |
Teraz, gdy wiemy, czym są przechylanie i unpivoting, zobaczmy, jak je zaimplementować w Power BI.
Przestawianie i przestawianie za pomocą Power BI
Najpierw zobaczmy przykład, jak przestawić pojedynczą kolumnę za pomocą edytora zapytań usługi Power BI. Jeśli spojrzysz na zbiór danych, zawiera on kolumnę o nazwie „Populacja”. Aby odwrócić kolumnę „Populacja”, kliknij nagłówek kolumny, a następnie wybierz opcję „Przekształć” z górnego menu. Zobaczysz nowe menu z kilkoma opcjami pojawiającymi się u góry, kliknij opcję „Kolumny Unpivot” z menu, a następnie kliknij „Kolumny Unpivot” z listy rozwijanej, jak pokazano poniżej:
Kolumna „Populacja” zostanie zastąpiona kolumnami „Atrybut” i „Wartość”, jak pokazano poniżej:
Teraz, aby przestawić kolumnę, masz dwie opcje. Możesz kliknąć opcję „x Unpivoted Columns” w oknie „Applied Steps”, jak pokazano na poniższym zrzucie ekranu.
Inną opcją jest wybranie kolumny, a następnie wybranie „Transform -> Pivot Column” z górnego menu, jak pokazano poniżej.
Podczas obracania kolumny musisz określić kolumnę, która zawiera wartości dla kolumny nieprzestawnej. W naszym przypadku kolumna „Wartość” zawiera wartości dla nieobrotowej kolumny „Atrybut”. Spójrz na poniższy zrzut ekranu w celach informacyjnych.
Obrócona kolumna „Populacja” wygląda tak:
Przesuń kolumnę „Populacja” tuż obok „Pop. Gęstość (na milę kwadratową)”, klikając nagłówek kolumny „Populacja” i przeciągając ją, jak pokazano na poniższym zrzucie ekranu.
Następnie przestawimy dwie kolumny, tj. „Populacja” i „Pop. Gęstość (na milę kwadratową)”. Wybierz oba nagłówki kolumn, a następnie przestaw je, jak pokazano poniżej:
Po przestawieniu powinny pojawić się następujące dwie kolumny utworzone w zestawie danych. Widać, że kolumna „Atrybut” zawiera teraz informacje o „Populacji” i „Pop. Gęstość (na milę kwadratową)”.
Wybierz oba nagłówki kolumn (CTRL + kliknięcie), a następnie przeciągnij kolumny tuż obok kolumny „Kraj”, jak pokazano poniżej.
Teraz możesz zobaczyć nazwy „krajów”, ich całkowitą populację i gęstość zaludnienia na milę kwadratową. Zmieńmy nazwę kolumny „Atrybut” na „Typ populacji”, ponieważ kolumna „Atrybut” pokazuje dwa typy populacji:całkowitą populację i gęstość zaludnienia na milę kwadratową. Zestaw danych ze zaktualizowaną nazwą nagłówka kolumny wygląda tak:
Podział kolumn
Przed podzieleniem kolumn zastąpimy niektóre wartości w kolumnie „Typ populacji”.
Wartość „Populacja” w kolumnie „Typ populacji” odnosi się do całej populacji. Zamienimy wartość „Populacja” na „Pop. Razem”, aby miał taki sam wzór jak „Pop. Gęstość (na milę kwadratową)”. Aby zastąpić wartości w kolumnach, przejdź do „Przekształć -> Zamień wartości”, jak pokazano na poniższym zrzucie ekranu.
Po zastąpieniu wartości zestaw danych wygląda tak.
Teraz podzielimy kolumnę „Typ populacji” na dwie. Jego pierwszych pięć znaków zostanie dodanych do pierwszej kolumny, a pozostałe znaki zostaną dodane do drugiej kolumny. Aby podzielić kolumnę, przejdź do „Przekształć -> Podziel kolumny”. Będziemy dzielić według pierwszych pięciu znaków, dlatego wybierz opcję „Podziel według liczby znaków” z menu rozwijanego. Podzielimy kolumnę przez pierwsze 5 znaków z lewej strony. W celach informacyjnych spójrz na poniższy zrzut ekranu.
Po podzieleniu kolumn powinieneś zobaczyć następujące dwie kolumny.
Potrzebujemy tylko kolumny „Population Type.2”, ponieważ zawiera ona informacje o typie lub skali populacji. Kliknij kolumnę „Typ populacji.1”, a następnie wybierz „Usuń”.
Na koniec możesz zmienić nazwę kolumny „Typ populacji.2” na „Typ populacji”, jak pokazano poniżej.
Na poniższym rysunku widać, że dla każdego kraju istnieją dwa różne typy wartości populacji. Wartość „Łącznie” w kolumnie „Typ populacji” odnosi się do całkowitej liczby ludności kraju. Rzeczywista wartość całej populacji jest przechowywana w kolumnie „Population Value”. Podobnie wartość „Gęstość (na milę kwadratową)” pokazuje, że ta wartość populacji odnosi się do gęstości zaludnienia.
Wniosek
Podsumowując, w artykule pokazano, jak wykonywać przestawianie i cofanie przestawiania w edytorze zapytań usługi Power BI. Dodatkowo obejmuje podstawową teorię stojącą za kolumnami obrotowymi i nieobrotowymi, zilustrowanymi jasnymi przykładami. W artykule wyjaśniono, jak zaimplementowano proces dzielenia kolumn w edytorze zapytań usługi Power BI.