Mysql
 sql >> Baza danych >  >> RDS >> Mysql

Skuteczny sposób obliczania procentu podobieństwa między zestawami danych

Standardowym sposobem na to jest podobieństwo Jaccarda. Jeśli A jest zbiorem celów pierwszego użytkownika, a B jest zbiorem celów drugiego użytkownika, podobieństwo Jaccarda to:

#(A intersect B)/#(A union B)

Jest to liczba wspólnych celów podzielona przez całkowitą liczbę głosów, które obaj mają razem (licząc cele, które dzielą tylko raz). Więc jeśli pierwszy użytkownik ma cele A={1,2,3}, a drugi ma cele B={2,4}, to jest tak:

A intersect B = {2}
A union B = {1,2,3,4}

#(A intersect B)/#(A union B) = 1/4

Podobieństwo Jaccarda wynosi zawsze od 0 (nie mają wspólnych celów) do 1 (mają te same cele), więc możesz uzyskać procent, mnożąc go przez 100.

http://en.wikipedia.org/wiki/Jaccard_index




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Czy przechowywanie liczników rekordów bazy danych jest zbędne?

  2. Zapytanie MySQL — identyfikowanie danych przy użyciu nazw URL, w których dane są zorganizowane w hierarchię

  3. MySQL sprawdza, czy dwa zakresy dat pokrywają się z danymi wejściowymi

  4. Hibernate @OneToMany wyrzuca MySQLSyntaxErrorException:Wystąpił błąd w składni SQL

  5. Wykonywanie procedury składowanej z kursorem w PHP