MongoDB przechowuje dane w zupełnie innym formacie, zwanym BSON, który zajmie więcej miejsca na dysku. Nie tylko wartości muszą być przechowywane dla każdego pola, ale także będą musiały ponownie przechowywać nazwy kolumn w każdym dokumencie (wierszu). Jeśli masz duże nazwy kolumn, z pewnością może to zwiększyć rozmiar w MongoDB do 8 do 10 razy w stosunku do pliku CSV. Jeśli to możliwe, możesz spróbować skrócić nazwy pól, jeśli to dla Ciebie za dużo.
MongoDB również wstępnie przydziela pliki danych dla Ciebie. Na przykład w momencie rozpoczęcia dodawania danych do taq.2
, utworzy taq.3
i podobnie, gdy zaczyna pisać do taq.4
tworzy tag.5
. Więc w twoim przypadku, powiedzmy, że twój plik 230 MB utworzyłby 1,9 GB danych, MongoDB już przydzielił taq.5
o rozmiarze 2,0 G . To zachowanie można wyłączyć, określając --noprealloc
w wierszu poleceń podczas uruchamiania mongod
.