У меня есть текст, как показано ниже.
Section <- c("If an infusion reaction occurs, interrupt the infusion.")
df <- data.frame(Section)
Когда я токенизирую с помощью tidytext и приведенного ниже кода,
AA <- df %>%
mutate(tokens = str_extract_all(df$Section, "([^\\s]+)"),
locations = str_locate_all(df$Section, "([^\\s]+)"),
locations = map(locations, as.data.frame)) %>%
select(-Section) %>%
unnest(tokens, locations)
Он дает мне жетоны, начальную и конечную позицию. Как получить теги POS при одновременном распаковывании. Что-то, как показано ниже (POStags могут быть неправильными на изображении ниже)