Это мой первый раз, когда я занимаюсь НЛП, поэтому, пожалуйста, извините мое невежество. Я ищу метод для извлечения интересов/лайков/хобби из социальных профилей пользователей. Вот пример, где все интересы/нравится/хобби выделены жирным шрифтом:
«Я считаю себя довольно разносторонним персонажем... Я профессиональный борец, но я готов принять пулю за Валл•И. Я тренируюсь как один- машина для геноцида людей в тренажерном зале, но я плакала под "Армагеддон". серьезно подумываю о том, чтобы сделать татуировку Legend of Zelda. Я дружу с 420. Мне нравится тусоваться с толпой братства однажды ночью, тусоваться с моим В следующий раз с друзьями на Burning Man, в следующий сыграйте в Halo и World of Warcraft, а в следующий раз играйте с друзьями, которым не меньше 40 лет. Мой младший другу 16, моему самому старшему другу 66. Я буду петь караоке в барах, и я коллективный психиатр/плечевой врач моих друзей».
Профили представляют собой обычный текст. С ним не связаны никакие метатеги или идентификаторы, это просто абзац текста.
Моя наивная идея состояла в том, чтобы взять каждое существительное и сопоставить его с Freebase, чтобы увидеть, относится ли оно к деятельности/исполнителю/фильму/ книга и т. д. Проблема в том, что, хотя большинство упоминаемых сущностей будут вещами, которые нравятся пользователю, он также будет упоминать вещи, которые ему не нравятся, и я не могу отличить 2.
У меня есть 2 вопроса:
- На какое подполе НЛП мне следует обратить внимание? Некоторые алгоритмы/методы/авторы, доступные для поиска в Google, будут очень признательны.
- Насколько сложна эта проблема?
Спасибо!