Zapytanie
Można to zrobić za pomocą struktury agregacji . Rozważ następny potok agregacji
db.collectionName.aggregate([
{
$group:
{
"_id": null,
"ds": { $push: "$$ROOT" },
"cs": { $push: "$c" }
}
}, /* (1) */
{ $unwind: "$ds" }, /* (2) */
{
$project:
{
"_id": "$ds._id",
"c": "$ds.c",
"cs": { $slice: [ "$cs", "$ds._id" ] }
}
}, /* (3): */
{ $unwind: "$cs" }, /* (4) */
{
$group:
{
"_id": "$_id",
"c": { $first: "$c" },
"csum": { $sum: "$cs" }
}
}, /* (5) */
{
$group:
{
"_id": null,
"ds": { $push: "$$ROOT" },
"gteC":
{
$push:
{
$cond:
{
if: { "$gte": [ "$csum", SET_DESIRED_VALUE_FOR_C_HERE ] },
then: "$$ROOT",
else: { }
}
}
}
}
}, /* (6) */
{
$project:
{
"_id": 0,
"docs":
{
$filter:
{
input: "$ds",
"as": "doc",
cond: { $lte: [ "$$doc.csum", { $min: "$gteC.csum" } ] }
}
}
}
}, /* (7) */
{ $unwind: "$docs" }, /* (8) */
{ $project: { "_id": "$docs._id", "c": "$docs.c" } } /* (9) */
]);
Wyniki
Wyjaśnienie
Podstawową ideą, która się za tym kryje, jest skonstruowanie tablicy pomocniczej dla każdego dokumentu w kolekcji (etapy 1-3 )
{ "_id" : 1, "c" : 2 } -> cs = [ 2 ]
{ "_id" : 2, "c" : 6 } -> cs = [ 2, 6 ]
{ "_id" : 3, "c" : 1 } -> cs = [ 2, 6, 1 ]
przy użyciu $slice
operator agregacji tablic a następnie zamień go na sumę wszystkich zawartych w nim elementów (etapy 4-5 )
{ "_id" : 1, "c" : 2 } -> csum = 2
{ "_id" : 2, "c" : 6 } -> csum = 8
{ "_id" : 3, "c" : 1 } -> csum = 9
przy użyciu $unwind
stage i $sum
operator akumulatora grupowego .
Następnie skonstruuj kolejną tablicę pomocniczą dokumentów za pomocą csum >= C
(etap 6 )
/* Ex. (C = 8) */
gteC = [ { "_id" : 3, "c" : 1, "csum" : 9 }, { "_id" : 2, "c" : 6, "csum" : 8 } ]
Ostatnim krokiem jest pobranie wszystkich dokumentów za pomocą csum <= Min { gteC.csum }
. Odbywa się to za pomocą $filter
operator agregacji tablic (etap 7 ).
Jednak nie na pewno jest to najwydajniejsze potok agregacji (będziemy wdzięczni za wszelkie sugestie dotyczące ulepszeń), aby osiągnąć to, czego chcesz.
PS Przed przetestowaniem zapytania nie zapomnij zmienić nazwy kolekcji i zastąpić SET_DESIRED_VALUE_FOR_C_HERE.