MongoDB przechowuje dane w zupełnie innym formacie, zwanym BSON, który zajmie więcej miejsca na dysku. Nie tylko wartości muszą być przechowywane dla każdego pola, ale także będą musiały ponownie przechowywać nazwy kolumn w każdym dokumencie (wierszu). Jeśli masz duże nazwy kolumn, z pewnością może to zwiększyć rozmiar w MongoDB do 8 do 10 razy w stosunku do pliku CSV. Jeśli to możliwe, możesz spróbować skrócić nazwy pól, jeśli to dla Ciebie za dużo.
MongoDB również wstępnie przydziela pliki danych dla Ciebie. Na przykład w momencie rozpoczęcia dodawania danych do taq.2 , utworzy taq.3 i podobnie, gdy zaczyna pisać do taq.4 tworzy tag.5 . Więc w twoim przypadku, powiedzmy, że twój plik 230 MB utworzyłby 1,9 GB danych, MongoDB już przydzielił taq.5 o rozmiarze 2,0 G . To zachowanie można wyłączyć, określając --noprealloc w wierszu poleceń podczas uruchamiania mongod .