To działa, spróbuj:
DELETE Customer_SCD
OUTPUT deleted.*
FROM Customer_SCD b
JOIN (
SELECT MIN(a.Customer_TimeStamp) Customer_TimeStamp,
Customer_ID,
Customer_Name
FROM Customer_SCD a
GROUP BY a.Customer_ID, a.Customer_Name
) c ON
c.Customer_ID = b.Customer_ID
AND c.Customer_Name = b.Customer_Name
AND c.Customer_TimeStamp <> b.Customer_TimeStamp
W podzapytaniu określa, który rekord jest pierwszym dla każdego Customer_Name
,Customer_ID
a następnie usuwa wszystkie inne rekordy dla duplikatu. Dodałem również OUTPUT
klauzula, która zwraca wiersze, których dotyczy instrukcja.
Możesz to również zrobić za pomocą funkcji rankingu ROW_NUMBER
:
DELETE Customer_SCD
OUTPUT deleted.*
FROM Customer_SCD b
JOIN (
SELECT Customer_ID,
Customer_Name,
Customer_TimeStamp,
ROW_NUMBER() OVER (PARTITION BY Customer_ID, Customer_Name ORDER BY Customer_TimeStamp) num
FROM Customer_SCD
) c ON
c.Customer_ID = b.Customer_ID
AND c.Customer_Name = b.Customer_Name
AND c.Customer_TimeStamp = b.Customer_TimeStamp
AND c.num <> 1
Zobacz, który z nich ma mniejszy koszt zapytania i użyj go, kiedy to sprawdziłem, pierwsze podejście było bardziej wydajne (miało lepszy plan wykonania).
Oto SQL Fiddle