Chodzi o to, aby poprawić wydajność zapytań agregujących, używając MapReduce na podzielonej na fragmenty bazie danych, która jest rozproszona na wielu komputerach.
Zrobiłem kilka porównań wydajności Mapreduce Mongo z instrukcją group-by-select w Oracle na tej samej maszynie. Okazało się, że Mongo było około 25 razy wolniejsze. Oznacza to, że muszę podzielić dane na co najmniej 25 maszyn, aby uzyskać taką samą wydajność w Mongo, jaką zapewnia Oracle na jednej maszynie. Użyłem zbioru/tabeli z około 14 milionami dokumentów/wierszy.
Wyeksportowanie danych z mongo za pomocą mongoexport.exe i użycie wyeksportowanych danych jako zewnętrznej tabeli w Oracle i wykonanie grupowania w Oracle było znacznie szybsze niż przy użyciu własnego MapReduce firmy Mongo.