PostgreSQL
 sql >> Baza danych >  >> RDS >> PostgreSQL

Usuń duplikaty z tabeli i ponownie połącz wiersze z odnośnikami do nowego wzorca

To pojedyncze polecenie powinno zrobić wszystko:

WITH blacklist AS (  -- identify duplicate IDs and their master
   SELECT *
   FROM  (
      SELECT transcription_id
           , min(transcription_id) OVER (PARTITION BY text, citation) AS master_id
      FROM   transcription
      ) sub
   WHERE  transcription_id <> master_id
   )
, upd AS (  -- redirect referencing rows
   UPDATE town_transcription tt
   SET    transcription_id = b.master_id
   FROM   blacklist b
   WHERE  b.transcription_id = tt.transcription_id
   )
DELETE FROM transcription t  -- kill dupes (now without reference)
USING  blacklist b
WHERE  b.transcription_id = t.transcription_id;

Z braku definicji wybrałem wiersz z najmniejszym identyfikatorem na grupę jako zachowany wiersz główny.

Ograniczenia FK nie przeszkadzają, chyba że masz ustawienia inne niż domyślne. Szczegółowe wyjaśnienie:

Po usunięciu duplikatów możesz teraz dodać UNIQUE ograniczenie, aby zapobiec ponownemu występowaniu tego samego błędu:

ALTER TABLE transcription
ADD CONSTRAINT transcription_uni UNIQUE (text, citation);


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Wyciszanie postgresu loguje spam w railach 3 logi

  2. Migracja istniejących danych auth.User do nowego niestandardowego modelu użytkownika Django 1.5?

  3. Konwertuj czas na sekundy w PostgreSQL

  4. Zrozumienie, jak zoptymalizować zapytanie za pomocą danych wyjaśniających Postgres/rails

  5. Jak ustrukturyzować czat w aplikacji?