PostgreSQL
 sql >> Baza danych >  >> RDS >> PostgreSQL

Pyspark:Usuń pusty znak UTF z ramki danych pyspark

Ach czekaj - chyba to mam. Jeśli zrobię coś takiego, wydaje się, że działa:

null = u'\u0000'
new_df = df.withColumn('e', regexp_replace(df['e'], null, ''))

A następnie mapowanie na wszystkie kolumny ciągów:

string_columns = ['d','e']
new_df = df.select(
  *(regexp_replace(col(c), null, '').alias(c) if c in string_columns else c for
    c in df.columns)
  )


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Znajdź proporcję każdego X składającego się z Y w PostgreSQL?

  2. Sortowanie miesięcy podczas konwertowania ich na tekst

  3. Otrzymuję błąd, że nie można zapisać bloku .... pliku tymczasowego brak miejsca na urządzeniu ... za pomocą postgresql

  4. Jak używać EXECUTE FORMAT ... USING w funkcji postgres

  5. Ustaw niestandardową strefę czasową w Django/PostgreSQL (Indyjski czas standardowy)