У меня есть фрейм данных pandas с большим количеством столбцов:
Col1 Col2 Col3 Col4
A1 B3 C2 D4
A2 B4 C3 D2
A5 B2 C1 D1
A4 B3 C2 D4
A5 B4 C3 D2
A2 B3 C4 D1
A3 B2 C3 D4
A1 B4 C3 D2
A4 B2 C1 D1
Я хочу разбить этот фрейм данных на n фрагментов, чтобы в каждом фрагменте была хотя бы одна строка, принадлежащая всем уникальным значениям столбца 4.
Например: если n=3
df1:
Col1 Col2 Col3 Col4
A1 B3 C2 D4
A2 B4 C3 D2
A5 B2 C1 D1
df2:
Col1 Col2 Col3 Col4
A4 B3 C2 D4
A5 B4 C3 D2
A2 B3 C4 D1
df3:
Col1 Col2 Col3 Col4
A3 B2 C3 D4
A1 B4 C3 D2
A4 B2 C1 D1
n=4
? Здесь мало уникальных случаев вCol4
. - person Little Bobby Tables   schedule 12.01.2018n=3
и в группеCol4
имеется болееn
уникальных записей для группы? Имеет ли значение, если у вас есть 5 в одном куске и 1 во всех остальных? например df1.Col4 = [D4, D4, D4, D2, D1], df2.Col4 = [D4, D2, D1]. - person Little Bobby Tables   schedule 12.01.2018