Możesz użyć df.map(row => ...), aby przekonwertować ramkę danych na RDD, jeśli chcesz zmapować wiersz na inny element RDD.
Na przykład:
val df = Seq(("table1",432),
("table2",567),
("table3",987),
("table1",789)).
toDF("tablename", "Code").toDF()
df.show()
+---------+----+
|tablename|Code|
+---------+----+
| table1| 432|
| table2| 567|
| table3| 987|
| table1| 789|
+---------+----+
val rddDf = df.map(r => (r(0), r(1))).rdd // Type:RDD[(Any,Any)]
OR
val rdd = df.map(r => (r(0).toString, r(1).toString)).rdd //Type: RDD[(String,String)]
Zapoznaj się z https://community.hortonworks.com/questions/106500/error-in-spark-streaming-kafka-integration-structu.html w sprawie AnalysisException:Zapytania ze źródłami przesyłania strumieniowego muszą być wykonywane za pomocą writeStream.start()
Musisz poczekać na zakończenie zapytania za pomocą zapytania.awaitTermination() Aby zapobiec zakończeniu procesu, gdy zapytanie jest aktywne.