Spark:wczytywanie dużej tabeli MySQL do DataFrame kończy się niepowodzeniem

Spark JDBC API wydaje się rozgałęziać, aby załadować wszystkie dane z tabeli MySQL do pamięci bez. Więc kiedy próbujesz załadować dużą tabelę, powinieneś najpierw użyć danych klonu Spark API do HDFS (JSON powinien być używany do zachowania struktury schematu), w ten sposób:

spark.read.jdbc(jdbcUrl, tableName, prop)
       .write()
       .json("/fileName.json");

Wtedy możesz normalnie pracować na HDFS.

spark.read().json("/fileName.json")
       .createOrReplaceTempView(tableName);

Zbuduj zapytanie wstawiające z tablicy MySQL i PHP

Tabela MySQL z kolumną TEXT

Database
Mysql
Oracle
Sqlserver
PostgreSQL
Access
SQLite
MariaDB

importowanie pliku sql do bazy danych za pomocą wamp
Instalacja Percona/MySQL bez nadzoru na Ubuntu
Zapytanie MySQL do ElasticSearch
Jak stwierdzić, kiedy zapytanie zostało pomyślnie wykonane w PHP PDO?
Jakie są różnice między SQL a MySQL

Tworzenie profili w Oracle dla bezpieczeństwa użytkownika

Najlepsze sposoby użycia instrukcji SQL DELETE w tabeli SQL

Szybka wskazówka MySQL:Używanie polecenia DROP USER

Minimalizowanie wpływu poszerzenia kolumny TOŻSAMOŚĆ – część 4