Я использую пакет tm для применения основы, и мне нужно преобразовать полученные данные в фрейм данных. Решение для этого можно найти здесь R tm package vcorpus: ошибка при преобразовании корпуса в кадр данных, но в моем случае у меня есть содержимое корпуса как:
[[2195]]
i was very impress
вместо
[[2195]]
"i was very impress"
и из-за этого, если я обращусь
data.frame(text=unlist(sapply(mycorpus, `[`, "content")), stringsAsFactors=FALSE)
результат будет
<NA>.
Любая помощь высоко ценится!
Код ниже в качестве примера:
sentence <- c("a small thread was loose on the sandals, otherwise it looked good")
mycorpus <- Corpus(VectorSource(sentence))
mycorpus <- tm_map(mycorpus, stemDocument, language = "english")
inspect(mycorpus)
[[1]]
a small thread was loo on the sandals, otherwi it look good
data.frame(text=unlist(sapply(mycorpus, `[`, "content")), stringsAsFactors=FALSE)
text
1 <NA>
deparse
в списке корпусов? - person Rich Scriven   schedule 25.08.2014deparse(data[[2195]])
- person Rich Scriven   schedule 25.08.2014