Mysql
 sql >> Baza danych >  >> RDS >> Mysql

Usunąć duplikaty za pomocą tylko zapytania MySQL?

Rozważ następujący przypadek testowy:

CREATE TABLE mytb (url_id int, url_addr varchar(100));

INSERT INTO mytb VALUES (1, 'www.google.com');
INSERT INTO mytb VALUES (2, 'www.microsoft.com');
INSERT INTO mytb VALUES (3, 'www.apple.com');
INSERT INTO mytb VALUES (4, 'www.google.com');
INSERT INTO mytb VALUES (5, 'www.cnn.com');
INSERT INTO mytb VALUES (6, 'www.apple.com');

Gdzie nasza tabela testowa zawiera teraz:

SELECT * FROM mytb;
+--------+-------------------+
| url_id | url_addr          |
+--------+-------------------+
|      1 | www.google.com    |
|      2 | www.microsoft.com |
|      3 | www.apple.com     |
|      4 | www.google.com    |
|      5 | www.cnn.com       |
|      6 | www.apple.com     |
+--------+-------------------+
5 rows in set (0.00 sec)

Następnie możemy użyć wielotabelowego DELETE składnia w następujący sposób:

DELETE t2
FROM   mytb t1
JOIN   mytb t2 ON (t2.url_addr = t1.url_addr AND t2.url_id > t1.url_id);

... co usunie zduplikowane wpisy, pozostawiając tylko pierwszy adres URL oparty na url_id :

SELECT * FROM mytb;
+--------+-------------------+
| url_id | url_addr          |
+--------+-------------------+
|      1 | www.google.com    |
|      2 | www.microsoft.com |
|      3 | www.apple.com     |
|      5 | www.cnn.com       |
+--------+-------------------+
3 rows in set (0.00 sec)

AKTUALIZUJ - Dalej do nowych komentarzy powyżej:

Jeśli zduplikowane adresy URL nie będą miały tego samego formatu, możesz zastosować REPLACE() funkcja usuwania www. lub http:// Części. Na przykład:

DELETE t2
FROM   mytb t1
JOIN   mytb t2 ON (REPLACE(t2.url_addr, 'www.', '') = 
                   REPLACE(t1.url_addr, 'www.', '') AND 
                   t2.url_id > t1.url_id);


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. EEE MMM dd GG:mm:ss ZZZ rrrr format daty do java.sql.Date

  2. Replikacja MySQL i przełączanie awaryjne oparte na GTID — szczegółowe informacje o błędnych transakcjach

  3. błąd:'Nie można połączyć się z lokalnym serwerem MySQL przez gniazdo '/var/run/mysqld/mysqld.sock' (2)' -- Brak /var/run/mysqld/mysqld.sock

  4. Doctrine 2 mysql FIELD funkcja w kolejności według

  5. SQL - Jak transponować?