Mysql
 sql >> Baza danych >  >> RDS >> Mysql

mySQL:Używanie odległości Levenshteina do znajdowania duplikatów w 20 000 wierszy

Znam co najmniej jedną optymalizację, która może skrócić czas działania o połowę:

AND a.id < b.id

Zapobiega to testowaniu a=1, b=2 po przetestowaniu a=2, b=1.

Jednak nadal będzie O(n^2), ale nie widzę, jak możesz coś z tym zrobić.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. SpringDataJPA zapisywanie relacji OneToOne uzyskiwanie Nie można dodać ani zaktualizować wiersza podrzędnego:ograniczenie klucza obcego nie działa

  2. przesłać plik do bazy danych MySql za pomocą PHP

  3. mysql Odmowa dostępu dla użytkownika [chroniony e-mail] (przy użyciu hasła:NIE) pomimo ustawienia hasła i wpisania go w identyfikatorze uri połączenia

  4. Zapytanie SPARQL, aby uzyskać wszystkich rodziców węzła

  5. Jak używać tych samych połączeń MySQL dla całej aplikacji Node.js?