У меня есть VCorpus, который извлекается следующим образом:
corp <- VCorpus(DirSource("//Filepath"))
Затем я хотел удалить определенные строки из моих файлов в Корпусе, которые содержали определенное слово. Для этого я преобразовал свой Корпус в as.character
:
corp <- sapply(corp, as.character)
а затем удалил все строки, включая слово ФАЙЛ:
for(j in seq(corp)) {
corp[[j]] <- corp[[j]][!grepl("FILE", corp[[j]], ignore.case = FALSE)]
}
Теперь я хочу вернуться к классу «VCorpus», чтобы использовать tm_map для выполнения задач по очистке корпуса, таких как:
corp <- tm_map(corp, content_transformer(tolower))
corp <- tm_map(corp, removeWords, stopwords("english"))
corp <- tm_map(corp, removePunctuation)
corp <- tm_map(corp, removeNumbers)
Но я получаю следующее сообщение об ошибке:
Ошибка в UseMethod("tm_map", x): нет применимого метода для 'tm_map', примененного к объекту класса "список"
Я пробовал несколько вещей, но я получаю сообщения об ошибках, такие как:
Ошибка в UseMethod("as.VCorpus"): нет применимого метода для 'as.VCorpus', примененного к объекту класса "character"
Любые идеи, как я могу вернуться к VCorpus и выполнять задачи tm_map?