MongoDB
 sql >> Baza danych >  >> NoSQL >> MongoDB

Jak usunąć puste tweety za pomocą filter() w pyspark?

Jeśli Twoje dane są takie

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

możesz użyć len(x) jako warunek filtra:

tweets.filter(lambda x: len(x) > 0).count()



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Jak mogę użyć częściowegoFilterExpression na modelu mangusty?

  2. Zapytanie typu sprzężenie mongodb z dwiema kolekcjami i klauzulą ​​where

  3. Jak zwrócić wartość logiczną w kategorii mongodb?

  4. Łączenie Spring-Data dla MongoDB i ElasticSearch

  5. Wzorzec modułu JavaScript z wywołaniem zwrotnym Ajax