PostgreSQL
 sql >> Baza danych >  >> RDS >> PostgreSQL

Połączenie Pyspark z bazą danych Postgres w notatniku ipython

Nie jestem pewien, dlaczego powyższa odpowiedź nie zadziałała dla mnie, ale pomyślałem, że mogę również podzielić się tym, co faktycznie działało dla mnie podczas uruchamiania pyspark z notebooka jupyter (Spark 2.3.1 - Python 3.6.3):

from pyspark.sql import SparkSession
spark = SparkSession.builder.config('spark.driver.extraClassPath', '/path/to/postgresql.jar').getOrCreate()
url = 'jdbc:postgresql://host/dbname'
properties = {'user': 'username', 'password': 'pwd'}
df = spark.read.jdbc(url=url, table='tablename', properties=properties)


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Znajdowanie sąsiednich wielokątów - zapytanie postgis

  2. Wartości NULL dla referential_constraints.unique_constraint_* kolumn w schemacie informacyjnym

  3. używasz kopii w postgresql?

  4. Ewolucja tolerancji błędów w PostgreSQL

  5. Dzień programisty PostgreSQL w Pradze 2016