Miła osoba z kanału IRC Postgresql pomogła znaleźć odpowiedź i stworzyć prawidłowe zapytanie. To właściwie jego zasługa, nie moja.
Pomógł uświadomić sobie, że albumy i źródła powinny być dodane do tablic dla porównania. Na przykład:
SELECT array_agg(rep_id), count(*) AS ct
FROM (SELECT rep_id,
data->>'background' as background,
array_agg(o->>'album' order by o->>'album') as albums,
array_agg(o->>'src' order by o->>'album') as srcs
FROM reports r,
json_array_elements(r.data->'objects') o
GROUP BY rep_id) s
GROUP BY background, albums, srcs
ORDER BY count(*) DESC
LIMIT 5;
Nie wiem, czy jest to najlepszy sposób, ale działa. Sugestie są mile widziane.