MongoDB
 sql >> Baza danych >  >> NoSQL >> MongoDB

Nie można wysłać danych do MongoDB za pomocą Kafka-Spark Structured Streaming

Zgodnie z błędem, masz już ciąg znaków (już zrobiłeś df.selectExpr("CAST(value AS STRING)") ), więc powinieneś spróbować uzyskać zdarzenie Row jako String , a nie Array[Byte]

Zacznij od zmiany

val valueStr = new String(record.getAs[Array[Byte]]("value"))

do

val valueStr = record.getAs[String]("value")

Rozumiem, że możesz już mieć klaster do uruchamiania kodu Spark, ale sugerowałbym nadal sprawdzanie Złącze Kafka Connect Mongo do zlewu dzięki czemu nie musisz pisać i utrzymywać własnego edytora Mongo w kodzie Spark.

Możesz też zapisać również zestawy danych Spark bezpośrednio do mongo




  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Eksportuj tablicę w csv z MongoDB

  2. npm install -g mongodb nie instalujesz mongodb globalnie w systemie OSX 10.8.4?

  3. Jak generowane są ObjectIds MongoDB?

  4. Kompleksy Mongoose (asynchroniczne) wirtualne

  5. Nie można połączyć się z obrazem dokowanym mongo za pomocą mongoose