Optymalny sposób w MongoDB w wersji 3.4.
Ta wersja mongod
zapewnia $split
operator, który oczywiście dzieli ciąg, jak pokazano tutaj
.
Następnie przypisujemy nowo obliczoną wartość do zmiennej za pomocą $let
operator zmienny. Nowa wartość może być następnie użyta w in wyrażenie zwracające wartości „imię” i „wiek” przy użyciu $arrayElemAt
operator do zwrócenia elementu pod określonym indeksem; 0
dla pierwszego elementu i -1
dla ostatniego elementu.
Zwróć uwagę, że w w wyrażenie musimy podzielić ostatni element, aby zwrócić ciąg liczb całkowitych.
Na koniec musimy iterować Kursor
obiektu i rzutuj przekonwertowany ciąg liczb całkowitych na liczbowy za pomocą Numer
lub parseInt
i użyj operacji zbiorczej oraz bulkWrite()
metoda $set
wartość dla tych pól dla maksymalnej wydajności.
let requests = [];
db.coll.aggregate(
[
{ "$project": {
"person": {
"$let": {
"vars": {
"infos": { "$split": [ "$person", "," ] }
},
"in": {
"name": { "$arrayElemAt": [ "$$infos", 0 ] },
"age": {
"$arrayElemAt": [
{ "$split": [
{ "$arrayElemAt": [ "$$infos", -1 ] },
" "
]},
-1
]
}
}
}
}
}}
]
).forEach(document => {
requests.push({
"updateOne": {
"filter": { "_id": document._id },
"update": {
"$set": {
"name": document.person.name,
"age": Number(document.person.age)
},
"$unset": { "person": " " }
}
}
});
if ( requests.length === 500 ) {
// Execute per 500 ops and re-init
db.coll.bulkWrite(requests);
requests = [];
}}
);
// Clean up queues
if(requests.length > 0) {
db.coll.bulkWrite(requests);
}
MongoDB 3.2 lub nowszy.
MongoDB 3.2 odrzuca starą Bulk()
API i powiązane metody
i udostępnia funkcję bulkWrite()
metoda, ale nie zapewnia $split
operatora, więc jedyną opcją, jaką mamy tutaj, jest użycie mapReduce()
metoda przekształcenia naszych danych, a następnie zaktualizuj kolekcję za pomocą operacji zbiorczej.
var mapFunction = function() {
var person = {},
infos = this.person.split(/[,\s]+/);
person["name"] = infos[0];
person["age"] = infos[2];
emit(this._id, person);
};
var results = db.coll.mapReduce(
mapFunction,
function(key, val) {},
{ "out": { "inline": 1 } }
)["results"];
results.forEach(document => {
requests.push({
"updateOne": {
"filter": { "_id": document._id },
"update": {
"$set": {
"name": document.value.name,
"age": Number(document.value.age)
},
"$unset": { "person": " " }
}
}
});
if ( requests.length === 500 ) {
// Execute per 500 operations and re-init
db.coll.bulkWrite(requests);
requests = [];
}}
);
// Clean up queues
if(requests.length > 0) {
db.coll.bulkWrite(requests);
}
MongoDB w wersji 2.6 lub 3.0.
Musimy użyć przestarzałego Bulk API .
var bulkOp = db.coll.initializeUnorderedBulkOp();
var count = 0;
results.forEach(function(document) {
bulkOp.find({ "_id": document._id}).updateOne(
{
"$set": {
"name": document.value.name,
"age": Number(document.value.age)
},
"$unset": { "person": " " }
}
);
count++;
if (count === 500 ) {
// Execute per 500 operations and re-init
bulkOp.execute();
bulkOp = db.coll.initializeUnorderedBulkOp();
}
});
// clean up queues
if (count > 0 ) {
bulkOp.execute();
}