Как я могу перебирать строки RDD и сравнивать одну строку со следующей в RDD?
Я знаю, что могу использовать цикл for следующим образом: for(x‹-rddItems), есть ли способ сделать что-то вроде x.next() внутри цикла for? или использовать некоторый индекс внутри for?
Благодарность
groupByKey
илиreduceByKey
, как предлагает @ipoteka. Это также должно быть быстрее, чем сортировка! - person Daniel Darabos   schedule 15.04.2015for
в ответах ниже, или вы можете использоватьseq.sliding
илиseq.zip(seq.tail)
для получения пар элементов, следующих друг за другом. - person Daniel Darabos   schedule 15.04.2015