Я пытаюсь создать DataFrame
с помощью RDD
.
Сначала я создаю RDD
, используя приведенный ниже код -
val account = sc.parallelize(Seq(
(1, null, 2,"F"),
(2, 2, 4, "F"),
(3, 3, 6, "N"),
(4,null,8,"F")))
Работает нормально -
учетная запись: org.apache.spark.rdd.RDD[(Int, Any, Int, String)] = ParallelCollectionRDD[0] при распараллеливании в: 27
но когда вы пытаетесь создать DataFrame
из RDD
, используя приведенный ниже код
account.toDF("ACCT_ID", "M_CD", "C_CD","IND")
Я получаю ошибку ниже
java.lang.UnsupportedOperationException: схема для типа Any не поддерживается
Я проанализировал, что всякий раз, когда я помещал значение null
в Seq
, только я получал ошибку.
Есть ли способ добавить нулевое значение?