долгое время искатель ответов, впервые задающий вопрос. У меня есть фрейм данных R, который представляет собой один столбец, 267 000 строк с 17 факторами, например:
regions
VE
PU
PR
DE
NU
AD
DE
NO
AD
Я пытаюсь извлечь их как последовательности столбцов с длиной 2 и 3, затем спуститься на 1 строку и повторить до конца. повторяет и заказывает настоящее. Я хочу взять вышеизложенное и сделать так:
s1 s2
VE PU
PU PR
PR DE
DE NU
NU AD
AD DE
DE NO
Я пытался использовать такие пакеты, как TraMinEr и ArulesSequences, но не могу в них разобраться. Я думаю, это потому, что мои последовательности являются чисто состояниями, к ним не прикреплена временная информация, даже в исходном наборе данных. Я также пытался создать свои собственные сценарии итераторов, но не смог. Я бесконечно гуглил, и я просто в тупике. Я не знаю, как это сделать. конечная цель состоит в том, чтобы сопоставить выходные данные с фреймом данных перестановки 2 или 3 и бинаризировать совпадения с 1, 0 для отсутствия совпадений и обработать этот x49 в новый фрейм данных.
Я не эксперт в программировании или R, просто начинающий пользователь. Кто-нибудь знает скрипт или пакет, который может это сделать?