Wyjątek podczas łączenia się z mongodb in spark

Myślę, że znalazłem problem:mongodb-hadoop ma "static" modyfikator na swoich instancjach kodera/dekodera BSON w core/src/main/java/com/mongodb/hadoop/input/MongoInputSplit.java. Gdy Spark działa w trybie wielowątkowym, wszystkie wątki próbują deserializować przy użyciu tego samego instancje kodera/dekodera, które prawdopodobnie mają złe wyniki.

Łatka na moim githubie tutaj (przesłał żądanie ściągnięcia w górę)

Jestem teraz w stanie uruchomić 8-rdzeniową wielowątkową platformę Spark->mongo collection count() z Pythona!

Spring Data MongoDB eliminuje POJO

Wewnętrzny błąd serwera stanu 500 w IE-11 z aplikacją Angular Js

MongoError:Sprawdzanie poprawności dokumentu nie powiodło się - Jak wstawić zarówno float, jak i int w to samo pole - które jest oznaczone jako podwójne?

Automatyzacja i zarządzanie bazami danych Open Source w chmurze — zapowiedź ClusterControl 1.6

Budowanie skalowalnego procesu przy użyciu NiFi, Kafka i HBase na CDP

MongoCollection::aggregate() jest niezdefiniowane w Heroku PHP przy użyciu MongoHQ