Я обрабатываю данные панели, такие как df. Итак, у меня есть уникальный идентификатор пользователя (Uid), переменная времени (TV) и основная интересующая меня переменная (MV, фиктивный код). Каждая строка представляет уникальную комбинацию UiD TV. Теперь я хочу создать новую переменную (NV), которая в основном подсчитывает количество событий (MV=1), которые произошли до времени TV.
Контекст: я хочу иметь переменную подсчета (NV), которая в основном подсчитывает для каждого момента времени, как часто событие MV=1 происходило до этого момента (TV).
Пока мне удается суммировать это только по UserId, но не на возрастающем уровне.
Что мне удалось до сих пор:
df <- df %>% group_by(user_id) %>% mutate(NV=count_if(1,MV))
Результат предоставляется my на совокупной основе для каждого идентификатора пользователя для MV.
Таким образом, ДФ выглядит так:
UI TV MV
1 1 0
1 2 1
1 3 0
2 1 0
2 2 0
2 3 1
2 4 2
3 1 1
3 2 0
3 3 1
3 4 1
Результаты с моим кодом до сих пор:
UI TV MV NV
1 1 0 1
1 2 1 1
1 3 0 1
2 1 0 2
2 2 0 2
2 3 1 2
2 4 2 2
3 1 1 3
3 2 0 3
3 3 1 3
3 4 1 3
Чего я на самом деле хочу:
UI TV MV NV
1 1 0 0
1 2 1 1
1 3 0 1
2 1 0 0
2 2 0 0
2 3 1 1
2 4 2 2
3 1 1 1
3 2 0 1
3 3 1 2
3 4 1 3
Заранее большое спасибо за помощь!