Mysql
 sql >> Baza danych >  >> RDS >> Mysql

Funkcja Jaro-winklera:dlaczego ten sam wynik pasuje do bardzo podobnych i bardzo różnych słów?

Wzór odległości Jaro-Winklera jest nastawiony na struny o wspólnym początku. Na przykład Valentina i Valentiria .

Ma też kilka niezbyt intuicyjnych „zasad” (patrz wikipedia ).

Powinieneś prawdopodobnie najpierw określić, jakiego rodzaju odmienności się spodziewasz, a następnie poszukać odpowiedniego wzoru na odległość. Na przykład w pisaniu słowa „angleworm” i „angelworm” są bardzo prawdopodobnym błędem, więc odległość między tymi dwoma strunami powinna być niewielka. Podczas gdy niedopasowanie „tam” i „trzy” jest mniej prawdopodobne, a „eter” jeszcze bardziej. Przy dłuższych anagramach odległość Jaro może być dokładnie taka sama, a nawet korekta Winklera może nie zadziałać.

Jak można przeczytać na tej stronie (podkreślenie moje)



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. mysqldump błąd:pakiet większy niż max_allowed_packet'

  2. MySQL — Model listy sąsiedztwa — Uzyskaj głębię

  3. Jak przekazać wiele wartości CheckBox przez AJAX i je przetworzyć?|

  4. Ogólne przechodzenie przez drzewo (nieskończone) w przeszukiwaniu wszerz;

  5. Jak utworzyć przechowywaną funkcję agregującą MySQL?