Я хочу извлечь имена пользователей из твита, где эти имена пользователей могут быть:
- за которыми следуют некоторые не буквенно-цифровые символы.
- без пробела перед ним.
Например, отсюда:
"RT@user1: This is a retweet that mentions @user2."
Я хотел бы получить вектор, например
[1] @user1 @user2
(с или без "@")
Это мой текущий скрипт:
text <- "RT@user1: This is a retweet that mentions @user2."
tokens <- unlist(strsplit(text, " "))
mentions.mask <- grepl("@\\w+", tokens)
mentions <- tokens[mentions.mask]
cat(mentions)
[1] "RT@user1:" "@user2."
Как я могу сделать это правильно?
text
, а вывод - вектором, содержащим@user1
и@user2
Разве это не ясно в моем вопросе? - person alberto   schedule 27.06.2015