У меня есть набор данных, содержащий более 6000 наблюдений, каждая запись имеет оценку от 0 до 100. Ниже приведен образец:
+-----+-------+
| uID | score |
+-----+-------+
| 1 | 77 |
| 2 | 61 |
| 3 | 74 |
| 4 | 47 |
| 5 | 65 |
| 6 | 51 |
| 7 | 25 |
| 8 | 64 |
| 9 | 69 |
| 10 | 52 |
+-----+-------+
Я хочу разделить их на равные децили на основе их ранжирования по отношению к их сверстникам в столбце оценок с отсечкой на каждом 10-м процентиле, как показано ниже:
+-----+-------+-----------+----------+
| uID | score | position% | scoreBin |
+-----+-------+-----------+----------+
| 7 | 25 | 0.1 | 1 |
| 4 | 47 | 0.2 | 2 |
| 6 | 51 | 0.3 | 3 |
| 10 | 52 | 0.4 | 4 |
| 2 | 61 | 0.5 | 5 |
| 8 | 64 | 0.6 | 6 |
| 5 | 65 | 0.7 | 7 |
| 9 | 69 | 0.8 | 8 |
| 3 | 74 | 0.9 | 9 |
| 1 | 77 | 1 | 10 |
+-----+-------+-----------+----------+
До сих пор я пробовал cut, cut2, tapply и т. д. Я думаю, что нахожусь на правильном логическом пути, но я понятия не имею, как применить их к моей ситуации. Любая помощь приветствуется.