MongoDB
 sql >> Baza danych >  >> NoSQL >> MongoDB

Szybki sposób na znalezienie duplikatów w indeksowanej kolumnie w mongodb

Osobiście stwierdziłem, że na dużych bazach danych (1TB i więcej) akceptowana odpowiedź jest strasznie powolna. Agregacja jest znacznie szybsza. Przykład jest poniżej:

db.places.aggregate(
    { $group : {_id : "$extra_info.id", total : { $sum : 1 } } },
    { $match : { total : { $gte : 2 } } },
    { $sort : {total : -1} },
    { $limit : 5 }
    );

Wyszukuje dokumenty, których extra_info.id jest używany dwa lub więcej razy, sortuje wyniki w kolejności malejącej danego pola i wyświetla pierwsze 5 jego wartości.



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Nieudana inicjalizacja globalna:BadValue Nieprawidłowa wartość lub brak ustawień regionalnych użytkownika. Upewnij się, że zmienne środowiskowe LANG i/lub LC_* są ustawione poprawnie

  2. Kodek MongoDB BSON nie jest używany podczas kodowania obiektu

  3. MapReduce z MongoDB naprawdę, bardzo wolno (30 godzin vs 20 minut w MySQL dla równoważnej bazy danych)

  4. node.js mongodb wybierz dokument według _id node-mongodb-native

  5. Jak zacząć korzystać z ClusterControl