У меня есть фрейм данных искры, который похож на
id start_time feature
1 01-01-2018 3.567
1 01-02-2018 4.454
1 01-03-2018 6.455
2 01-02-2018 343.4
2 01-08-2018 45.4
3 02-04-2018 43.56
3 02-07-2018 34.56
3 03-07-2018 23.6
Я хочу иметь возможность разделить это на два фрейма данных на основе столбца id. Поэтому я должен сгруппировать по столбцу id, отсортировать по start_time и взять 70% строк в один фрейм данных и 30% строки в другой кадр данных, сохраняя порядок. Результат должен выглядеть так:
Dataframe1:
id start_time feature
1 01-01-2018 3.567
1 01-02-2018 4.454
2 01-02-2018 343.4
3 02-04-2018 43.56
3 02-07-2018 34.56
Dataframe2:
1 01-03-2018 6.455
2 01-08-2018 45.4
3 03-07-2018 23.6
Я использую Spark 2.0 с Python. Каков наилучший способ реализовать это?