Zakładam, że masz dużo punktów i potrzebujesz szybkich wyników - w przeciwnym razie możesz użyć prawie wszystkiego.
Wydaje mi się, że to praca polegająca na zmniejszeniu mapy
Część mapy byłaby pętlą „dla każdego nieodwiedzonego punktu” i powinna emitować konstrukcję danych zawierającą sąsiadów, klastry kandydujące i cokolwiek innego. W przypadku, gdy punkt jest zaklasyfikowany jako hałas, nie powinien nic emitować.
Rozbudowa klastra powinna zostać zredukowana i ewentualnie sfinalizowana - również wybór języka byłby javascript i wszystko działo się w mongo