MongoDB
 sql >> Baza danych >  >> NoSQL >> MongoDB

czy mapa/redukcja jest odpowiednia do znalezienia mediany i modu zbioru wartości dla wielu rekordów?

Tutaj pojawia się kluczowe pytanie dotyczące oczekiwanego wyniku. Z Twojego pytania nie wynika w 100%, który z nich chcesz.

Czy chcesz (A) :

{ _id: "document1", value: { mode: 1.0, median: 10.0 } }
{ _id: "document2", value: { mode: 5.0, median: 150.0 } }
... one for each document

... czy chcesz (B) , tryb i mediana we wszystkich kombinacjach wszystkich tablic.

  • Jeśli odpowiedź brzmi (A) , wtedy Map/Reduce będzie działać .
  • Jeśli odpowiedź brzmi (B) , wtedy Map/Reduce prawdopodobnie nie będzie działać .

Jeśli planujesz zrobić (A) , prosimy o dokładne zapoznanie się z dokumentacją M/R i zrozumienie ograniczeń. Podczas gdy opcja (A) może być mapą/redukcją, może też być po prostu dużym for pętla z upsert na "podsumowaniu" kolekcji lub nawet z powrotem do oryginalnej kolekcji. Może to być jeszcze bardziej wydajne.



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. MongoDB na serwerze EC2 czy AWS SimpleDB?

  2. Określanie kolekcji podzielonej na fragmenty za pomocą danych Spring Data MongoDB

  3. Zapytaj i zsumuj wszystko z mangustą

  4. Importowanie csv do mongodb za pomocą kodu PHP

  5. czy jest to optymalna minimalna konfiguracja dla mongodb, aby umożliwić sharding/skalowanie?