Database
 sql >> Baza danych >  >> RDS >> Database

Trendy ScyllaDB – jak użytkownicy wdrażają bazę danych Big Data w czasie rzeczywistym

ScyllaDB to rozproszony magazyn danych NoSQL typu open source, zaimplementowany ponownie z popularnej bazy danych Apache Cassandra. Wydana zaledwie cztery lata temu, w 2015 roku, Scylla odnotowała średnio ponad 220% wzrost popularności rok do roku według DB-Engines. Dużo słyszeliśmy o tej rosnącej bazie danych od społeczności DBA i naszych użytkowników i postanowiliśmy zostać sponsorem tegorocznego Scylla Summit, aby dowiedzieć się więcej o trendach wdrożeniowych od jej użytkowników. W tym poście dzielimy chmurę ScyllaDB w porównaniu z wdrożeniami lokalnymi, najpopularniejszych dostawców usług w chmurze, bazy danych SQL i NoSQL używane z ScyllaDB, najbardziej czasochłonne zadania związane z zarządzaniem oraz dlaczego warto używać ScyllaDB w porównaniu z Cassandra.

  • ScyllaDB kontra Cassandra
  • ScyllaDB Cloud a ScyllaDB On-Premises
  • Najpopularniejsi dostawcy usług w chmurze dla ScyllaDB
  • Bazy danych najczęściej używane w ScyllaDB
  • Najbardziej czasochłonne zadania zarządzania ScyllaDB

ScyllaDB kontra Cassandra – co jest lepsze?

Zastanawiasz się, którego magazynu szerokokolumnowego użyć do swoich wdrożeń? Podczas gdy Cassandra jest nadal najpopularniejsza, ScyllaDB szybko zyskuje jako siódmy najpopularniejszy sklep z szeroką kolumną według DB-Engines. Jakie są więc powody, dla których użytkownicy wybierali ScyllaDB vs. Cassandra?

ScyllaDB oferuje znacznie mniejsze opóźnienia, co pozwala na przetwarzanie dużej ilości danych przy minimalnym opóźnieniu. W rzeczywistości, zgodnie z raportem porównawczym wydajności ScyllaDB, ich 99,9 percentyla opóźnienia jest do 11 razy lepsze niż Cassandra na gołym metalu AWS EC2. Więc tego typu wydajność musi mieć swoją cenę, prawda? Tak, ale w tym raporcie twierdzą, że jest to 2,5-krotna redukcja kosztów w porównaniu z uruchomieniem Cassandry, ponieważ mogą osiągnąć tę wydajność tylko z 10% węzłów.

Istnieją dziesiątki wartościowych artykułów na temat ScyllaDB i Cassandry, więc zatrzymamy się tutaj, abyśmy mogli dotrzeć do prawdziwego celu tego artykułu, rozkładając dane użytkownika ScyllaDB .

ScyllaDB Cloud a ScyllaDB On-Premises

ScyllaDB można uruchomić zarówno w chmurze publicznej, jak i lokalnie. W rzeczywistości ScyllaDB jest najczęściej wdrażany zarówno w chmurze publicznej, jak i środowiskach lokalnych w ramach jednej organizacji. 44% wdrożeń ScyllaDB wykorzystujących zarówno przetwarzanie w chmurze, jak i lokalne może odbywać się za pośrednictwem hybrydowego środowiska chmury, wykorzystującego zarówno dla określonej aplikacji, jak i używając tych środowisk oddzielnie do zarządzania różnymi aplikacjami.

Wdrożenia lokalne ScyllaDB i wdrożenia chmurowe ScyllaDB były martwe — nawet po 28%. Możesz uruchomić zarówno darmową wersję open source ScyllaDB, jak i ScyllaDB Enterprise w chmurze lub lokalnie, a licencja ScyllaDB Enterprise zaczyna się od 28,8 tys. USD rocznie, co daje łącznie 48 rdzeni.

Jaki jest najlepszy sposób na wdrożenie #ScyllaDB? Chmura a lokalnaKliknij, aby tweetować

Najpopularniejsi dostawcy usług w chmurze dla ScyllaDB

Zważywszy, że 28% klastra ScyllaDB jest wdrażanych wyłącznie w chmurze, a 72% korzysta z chmury w pewnym zakresie, chcieliśmy zobaczyć, którzy dostawcy usług w chmurze są najbardziej popularni w przypadku obciążeń ScyllaDB .

#1. AWS

Odkryliśmy, że 39,1% wszystkich wdrożeń w chmurze ScyllaDB działa w AWS od naszych uczestników ankiety. Chociaż spodziewaliśmy się, że AWS będzie dostawcą nr 1 w chmurze dla ScyllaDB, odsetek ten był znacznie niższy niż odpowiedzi ze wszystkich typów baz danych w chmurze w tej ankiecie, które wykazały, że 55% zostało wdrożonych w AWS. Ta liczba jest bardziej zgodna z naszym ostatnim raportem trendów w bazach danych Open Source z 2019 r., w którym 56,9% wdrożeń w chmurze zostało uruchomionych w AWS. Może to wynikać z tego, że AWS nie obsługuje ScyllaDB za pośrednictwem usług relacyjnych baz danych (RDS), więc możemy postawić hipotezę, że ponieważ coraz więcej organizacji kontynuuje migrację swoich danych do ScyllaDB, AWS może doświadczyć spadku liczby klientów.

#2. Google Cloud

Google Cloud Platform (GCP) była drugim najpopularniejszym dostawcą chmury dla ScyllaDB, osiągając 30,4% wszystkich wdrożeń w chmurze. Google Cloud oferuje własny magazyn z szeroką kolumną i bazę danych big data o nazwie Bigtable, która w rzeczywistości zajmuje 11 miejsce, jedna pod ScyllaDB na 110 w DB-Engines. Niskie koszty i wysoka wydajność ScyllaDB sprawiają, że jest to atrakcyjna opcja dla użytkowników GCP, zwłaszcza że jest to oprogramowanie typu open source w porównaniu z Bigtable, który jest dostępny komercyjnie tylko w GCP.

#3. Lazurowy

Na trzecim miejscu znalazła się platforma Azure, reprezentująca 17,4% wszystkich wdrożeń ScyllaDB w chmurze uwzględnionych w naszych ankietach. Azure to atrakcyjny dostawca chmury dla organizacji korzystających z pakietu usług Microsoft.

Który dostawca chmury jest najpopularniejszy dla #ScyllaDB? AWS vs. Azure vs. GCPCKliknij, aby tweetować

Pozostałe 13,0% wdrożeń w chmurze ScyllaDB działało w usługach przetwarzania w chmurze DigitalOcean, Alibaba i Tencent.

Ich zarządzana usługa, Scylla Cloud, jest obecnie dostępna tylko w AWS i musisz użyć wersji ScyllaDB Enterprise, aby wykorzystać ich DBaaS. Scylla Cloud planuje w przyszłości dodać obsługę GCP i Azure, ale mając tylko 39% raportowania w AWS, możemy założyć, że ponad 60% wdrożeń ScyllaDB jest samozarządzanych w chmurze.

Bazy danych najczęściej używane w ScyllaDB

Jak również stwierdzono w raporcie Open Source Database Report 2019, organizacje wykorzystują średnio 3.1 różnych typów baz danych. Jednak w tej ankiecie organizacje korzystające ze ScyllaDB zgłosiły, że używają średnio tylko 2,3 różnych typów baz danych, co stanowi 26-procentową redukcję w porównaniu z naszymi wynikami dotyczącymi wszystkich użytkowników baz danych typu open source. Odkryliśmy również, że 39% wdrożeń ScyllaDB używa tylko ScyllaDB i nie wykorzystuje żadnego innego typu bazy danych w swoich aplikacjach.

Które bazy danych są więc najczęściej używane w połączeniu ze ScyllaDB? Odkryliśmy, że użytkownicy ScyllaDB korzystają również z baz danych SQL MySQL 20% czasu i PostgreSQL 20% czasu. Drugą najczęściej używaną bazą danych z ScyllaDB była Cassandra reprezentowana w 16% wdrożeń i możemy założyć, że jest to spowodowane przez organizacje testujące ScyllaDB jako alternatywę dla Cassandry w swoich aplikacjach, ponieważ oba typy baz danych to magazyny z szerokimi kolumnami.

MongoDB była czwartą najczęściej wdrażaną bazą danych ze ScyllaDB na poziomie 12%. Redis i Elasticsearch uplasowali się na piątym miejscu, obydwa wykorzystują 8% czasu dzięki wdrożeniom ScyllaDB.

Odkryliśmy również, że 20% wdrożeń Scylla wykorzystuje inne typy baz danych, w tym Oracle, Aerospike, Kafka (która obecnie przekształca się w bazę danych do strumieniowego przesyłania zdarzeń), DB2 i Tarantool.

Najbardziej czasochłonne zadania zarządzania ScyllaDB

Wiemy, że ScyllaDB ma szerokie możliwości, ale czy jest łatwa w użyciu? Zapytaliśmy użytkowników ScyllaDB, jakie jest ich najbardziej czasochłonne zadanie zarządzania, i od 28% usłyszeliśmy, że naprawa Scylla jest najdłuższym zadaniem zarządzania. Scylla Repair to proces synchronizacji, który działa w tle, aby upewnić się, że wszystkie repliki ostatecznie przechowują te same dane. Użytkownicy muszą regularnie uruchamiać polecenie naprawy nodetool, ponieważ nie ma możliwości zautomatyzowania napraw w wersjach ScyllaDB open source lub ScyllaDB Enterprise, ale można skonfigurować harmonogram napraw za pomocą Scylla Manager.

Powolna analiza zapytań ScyllaDB zajęła drugie miejsce w przypadku tworzenia kopii zapasowych i odzyskiwania ScyllaDB po 14% w przypadku najbardziej czasochłonnego zadania zarządzania. Wygląda na to, że ScyllaDB nie ma obecnie dostępnego analizatora zapytań do identyfikowania zapytań wymagających optymalizacji, ale użytkownicy mogą użyć swojego powolnego rejestrowania zapytań, aby zobaczyć, które zapytania mają najdłuższy czas odpowiedzi. Kopie zapasowe ScyllaDB również nie mogą być zautomatyzowane za pomocą wersji open source i korporacyjnych, ale stwierdzają, że cykliczne kopie zapasowe będą dostępne w przyszłych wydaniach Scylla Manager. Nie ma również zautomatyzowanego sposobu na przywrócenie kopii zapasowej ScyllaDB, ponieważ muszą one być wykonywane ręcznie we wszystkich wersjach.

10% użytkowników ScyllaDB zgłosiło, że dodawanie, usuwanie lub zastępowanie węzłów było najbardziej czasochłonnym zadaniem, zajmując czwarte miejsce. Są to procesy ręczne, które mogą zająć trochę czasu, zwłaszcza jeśli masz do czynienia z dużym rozmiarem danych. Dodanie węzłów służy do skalowania wdrożenia, a usunięcie ich powoduje skalowanie wdrożenia w dół. Węzły muszą zostać wymienione, jeśli są wyłączone lub martwe, chociaż klaster może być nadal dostępny, gdy więcej niż jeden węzeł jest wyłączony.

Na piątym miejscu z wynikiem 7% uplasowały się aktualizacje i rozwiązywanie problemów. Zarówno ScyllaDB Enterprise, jak i open source wymagają obszernych kroków w celu uaktualnienia klastra. Zalecane metody to procedura krocząca, więc nie ma przestojów, ale jest to proces ręczny, więc użytkownik musi wyłączyć jeden węzeł na raz, wykonać wszystkie kroki aktualizacji, ponownie uruchomić i zweryfikować węzeł przed przejściem do wykonywania te same kroki dla pozostałych węzłów w klastrze. Rzeczywiście czasochłonne, ale na szczęście nie codzienne zadanie! Rozwiązywanie problemów to oczywiście głęboka królicza dziura, w którą można się zanurzyć, ale klienci ScyllaDB Enterprise otrzymują całodobowe wsparcie o znaczeniu krytycznym, a użytkownicy open source mają dostęp do mnóstwa zasobów, w tym dokumentacji, list mailingowych, Uniwersytetu Scylla i kanału Slack dla użytkownika dyskusje.

Jakie jest najbardziej czasochłonne zadanie zarządzania #ScyllaDB? Kliknij, aby tweetować

Pozostałe 21% czasochłonnych zadań zgłaszanych przez użytkowników ScyllaDB obejmuje monitorowanie, migracje, udostępnianie, równoważenie fragmentów, kompaktowanie i łatanie.

Więc, jak te wyniki mają się do wdrożeń ScyllaDB? Szukasz sposobu na zautomatyzowanie tych czasochłonnych zadań związanych z zarządzaniem? Chociaż dzisiaj obsługujemy bazy danych MySQL, PostgreSQL, Redis™* i MongoDB®, zawsze oczekujemy opinii na temat tego, którą bazę danych dodać w następnej kolejności w ramach naszych planów DBaaS. Daj nam znać w komentarzach lub na Twitterze w @scalegridio, jeśli szukasz łatwiejszego sposobu zarządzania klastrami ScyllaDB w chmurze lub lokalnie!


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Typ danych T-SQL Data/godzina

  2. Podejścia do bezpieczeństwa w modelowaniu danych. Część 3

  3. Praca z danymi JDBC spoza ASCII w Talend

  4. Korzystanie z danych chronionych za pomocą niestandardowego magazynu kluczy z systemu Linux

  5. Wyszukiwanie tabel w pracach IRI zgodnych z SortCL