To pojedyncze polecenie powinno zrobić wszystko:
WITH blacklist AS ( -- identify duplicate IDs and their master
SELECT *
FROM (
SELECT transcription_id
, min(transcription_id) OVER (PARTITION BY text, citation) AS master_id
FROM transcription
) sub
WHERE transcription_id <> master_id
)
, upd AS ( -- redirect referencing rows
UPDATE town_transcription tt
SET transcription_id = b.master_id
FROM blacklist b
WHERE b.transcription_id = tt.transcription_id
)
DELETE FROM transcription t -- kill dupes (now without reference)
USING blacklist b
WHERE b.transcription_id = t.transcription_id;
Z braku definicji wybrałem wiersz z najmniejszym identyfikatorem na grupę jako zachowany wiersz główny.
Ograniczenia FK nie przeszkadzają, chyba że masz ustawienia inne niż domyślne. Szczegółowe wyjaśnienie:
- Jak usunąć zduplikowane wiersze z zależnościami kluczy obcych?
- Usuń duplikaty i przekieruj wiersze odniesienia do nowego wzorca
Po usunięciu duplikatów możesz teraz dodać UNIQUE
ograniczenie, aby zapobiec ponownemu występowaniu tego samego błędu:
ALTER TABLE transcription
ADD CONSTRAINT transcription_uni UNIQUE (text, citation);