Mysql
 sql >> Baza danych >  >> RDS >> Mysql

Spark JoinWithCassandraTable na kluczu partycji TimeStamp STUCK

Używając:

sc.parallelize(startDate to endDate)

Z danymi startData i endDate jako długimi wygenerowanymi z dat według formatu:

("yyyy-MM-dd HH:mm:ss")

Zrobiłem iskrę, aby zbudować ogromną tablicę (ponad 100 000 obiektów) do połączenia z tabelą C* i wcale nie utknęła - C * ciężko pracował, aby złączyć się i zwrócić dane.

Wreszcie zmieniłem swój zakres na:

case class TableKey(created_dh: String)
val data = Array("2015-10-29 12:00:00", "2015-10-29 13:00:00", "2015-10-29 14:00:00", "2015-10-29 15:00:00")
val snapshotsFiltered = sc.parallelize(data, 2).map(TableKey(_)).joinWithCassandraTable("listener","snapshots_tnew")

I teraz jest w porządku.




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Jak stworzyć tunel ssh w ruby, a następnie połączyć się z serwerem mysql na zdalnym hoście?

  2. Czy używając SELECT możesz modyfikować wartość zwracanego pola na podstawie innych pól?

  3. Wyszukiwanie pełnotekstowe MySQL, dlaczego otrzymuję nieprawidłowe argumenty do dopasowania?

  4. MacOSX:autostart mysql przy starcie

  5. Czy to dziwne, że moje połączenie SQLAlchemy MySQL zawsze kończy się uśpieniem?