HyperLogLog
służy do liczenia unikalnych przedmiotów. Potrafi policzyć dużą liczbę elementów przy niewielkiej pamięci. Jednak zwrócona kardynalność NIE jest dokładna, ale przybliżona za pomocą standard error
.
0,81% to standard error
, NIE fałszywy alarm. W swoim przypadku możesz wywołać PFCOUNT HLL
aby uzyskać przybliżoną liczbę unikalnych elementów, które umieściłeś w HyperLogLog
. Zwracana liczba powinna mieścić się w zakresie [10000 * (1 - 0.81%), 10000 * (1 + 0.81%)]
.
PFADD
zwraca 1, jeśli szacowana kardynalność uległa zmianie po wykonaniu polecenia. Zwraca 0, w przeciwnym razie. Nie ma to nic wspólnego z false positive
.
Wygląda na to, że potrzebujesz filtra Blooma, który może powiedzieć, czy element już istnieje w zestawie danych, z fałszywym alarmem. Możesz zaimplementować Bloom Filter
oczywiście z Redisem. I powinien być do tego jakiś projekt open source.