У меня есть один небольшой дополнительный вопрос о биннинге в python pandas.
У меня есть кадр данных, подобный следующему:
df =
variable test_score
-1 52.0
1 53.0
4 54.0
6 64.0
6 64.0
-6 64.0
5 71.0
10 73.0
-15 75.0
4 77.0
....... etc, etc....
Я хотел бы создать корзину по отношению к столбцу/переменной «переменной», чтобы в каждой «переменной» ячейке отображалось одинаковое количество строк «X» (скажем, 100).
Затем я хотел бы построить график рассеяния центрального значения каждой корзины переменной ((variable_bin_min + variable_bin_max)/2) в зависимости от среднего значения результатов теста для этой корзины переменных.
Я не вижу простого способа сделать это и был бы признателен за любое руководство!