Postgresql ON CONFLICT w sqlalchemy

Korzystanie z Postgres 9.6.1, sqlachemy 1.1.4 i psycopg2 2.6.2:

Przekształć strukturę danych w słownik. Od Pand to jest

import pandas
from sqlalchemy import MetaData
from sqlalchemy.dialects.postgresql import insert
import psycopg2

# The dictionary should include all the values including index values
insrt_vals = df.to_dict(orient='records')

Połącz się z bazą danych przez sqlalchemy . Zamiast tego wypróbuj sterownik psycog2 pod spodem i natywną funkcję COPY, która omija wszelkie indeksowanie postgres.

csv_data = os.path.realpath('test.csv')
con = psycopg2.connect(database = 'db01', user = 'postgres')
cur = con.cursor()
cur.execute("\copy stamm_data from '%s' DELIMITER ';' csv header" % csv_data)
con.commit()

Wykonaj

results = engine.execute(do_nothing_stmt)
# Get number of rows inserted
rowcount = results.rowcount

Ostrzeżenie:

Ta metoda nie działa z NaT s po wyjęciu z pudełka.

Wszystko razem

tst_df = pd.DataFrame({'colA':['a','b','c','a','z', 'q'],
              'colB': pd.date_range(end=datetime.datetime.now() , periods=6),
              'colC' : ['a1','b2','c3','a4','z5', 'q6']})


insrt_vals = tst_df.to_dict(orient='records')
engine =      sqlalchemy.create_engine("postgresql://user:example@sqldat.com/postgres")
connect = engine.connect()
meta = MetaData(bind=engine)
meta.reflect(bind=engine)
table = meta.tables['tstbl']
insrt_stmnt = insert(table).values(insrt_vals)

do_nothing_stmt  = insrt_stmnt.on_conflict_do_nothing(index_elements=['colA','colB'])
results = engine.execute(do_nothing_stmt)

Zamiast kroków 2 i 3, użyj psycog2 sterownik z poleceniem kopiowania w postgresie jest szybszy w przypadku większych plików (zbliżających się do koncertu), ponieważ wyłącza indeksowanie wszystkich tabel.

csv_data = os.path.realpath('test.csv')