PostgreSQL
 sql >> Baza danych >  >> RDS >> PostgreSQL

Dlaczego różne wyniki liczenia przy kolejnych odczytach?

Chyba że Dataset jest cached korzystanie z niezawodnego magazynu (standardowa cache Sparka da tylko słabe gwarancje) dostęp do bazy danych można uzyskać wielokrotnie, za każdym razem pokazując aktualny stan bazy. Od

widzenie różnych liczb jest oczekiwanym zachowaniem.

Ponadto, jeśli źródło JDBC jest używane w trybie rozproszonym (z kolumną partycjonującą lub predicates ), wtedy każdy wątek executora użyje własnej transakcji. W rezultacie stan Dataset może nie być w pełni spójne.

Nie używaj JDBC. Możesz na przykład

  • COPY dane do systemu plików i załaduj je stamtąd.
  • Użyj wybranego przez siebie rozwiązania do replikacji, aby utworzyć replikę dedykowaną do analiz oraz ustawić i wstrzymać replikację podczas korzystania z analizy danych.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Postgres podzielił ciąg znaków z podwójnymi cudzysłowami na wiele wierszy?

  2. Jak połączyć kontener aplikacji webowej Docker z kontenerem Docker PostgreSQL?

  3. Zaktualizuj rekordy, które spełniają warunek z rosnącą liczbą

  4. Używanie złączeń do łączenia danych z różnych tabel w PostgreSQL

  5. Jak połączyć wszystkie wyniki z wiersza tabeli?