Mysql
 sql >> Baza danych >  >> RDS >> Mysql

porównaj zbiory danych i zwróć najlepsze dopasowanie

Pomogłoby, gdybyś pokazał nam swoje struktury tabel, abym mógł być bardziej szczegółowy.

Zakładam, że masz strukturę podobną do tej:

Table item: (id, itemname)
1 item1
2 item2
3 item3
4 item4
5 item5

Table tag: (id, tagname)
1 cool
2 red
3 car

Table itemtag: (id, itemid, tagid)
1 1 2 (=item1, red)
2 2 1 (=item2, cool)
3 2 3 (=item2, car)
4 3 1 (=item3, cool)
5 3 2 (=item3, red)
6 3 3 (=item3, car)
7 4 3 (=item3, car)
8 5 3 (=item3, car)

Ogólnie moje podejście polegałoby na rozpoczęciu od zliczenia każdego oddzielnego tagu.

-- make a list of how often a tag was used:
select tagid, count(*) as `tagscore` from itemtag group by tagid

Pokazuje wiersz dla każdego tagu, który został przypisany do elementu, z wynikiem.

W naszym przykładzie byłoby to:

tag  tagscore
1    2         (cool, 2x)
2    2         (red, 2x)
3    4         (car, 4x)


set @ItemOfInterest=2;

select
  itemname,
  sum(tagscore) as `totaltagscore`,
  GROUP_CONCAT(tags) as `tags`
from
  itemtag
join item on itemtag.itemid=item.id

join
  /* join the query from above (scores per tag) */
  (select tagid, count(*) as `tagscore` from itemtag group by tagid ) as `TagScores`
  on `TagScores`.tagid=itemtag.tagid
where
  itemid<>@ItemOfInterest and 
  /* get the taglist of the current item */
  tagid in (select distinct tagid from itemtag where [email protected])
group by
  itemid
order by
  2 desc

Objaśnienie:Zapytanie zawiera 2 podzapytania:Jednym z nich jest uzyskanie znaczników listy z interesującego nas elementu. Chcemy tylko z nimi pracować. Drugie podzapytanie generuje listę wyników na tag.

Tak więc na końcu każda pozycja w bazie danych ma listę wyników tagów. Te wyniki są sumowane za pomocą sum(tagscore) , a liczba ta jest używana do uporządkowania wyniku (najwyższe wyniki na górze).

Aby wyświetlić listę dostępnych tagów, użyłem GROUP_CONCAT.

Zapytanie da wynik podobny do tego (właściwe dane umieściłem tutaj):

Item   TagsScore   Tags
item3  15          red,cool,car
item4   7          red,car
item5   7          red
item1   5          car
item6   5          car 


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Servicestack:Obsługa indeksów, automatyczne zwiększanie itp. bez atrybutów?

  2. MySQL (5.7) usuwa procedury składowane przez mysql.proc

  3. zapytanie mysqli zwraca tylko pierwszy wiersz

  4. Dwa indeksy jednokolumnowe a jeden indeks dwukolumnowy w MySQL?

  5. Czy szyfrowanie AWS RDS z KMS wpływa na wydajność?