Публикации по теме 'subreddits'


Идентификация субреддита с использованием анализа НЛП
Цель этого проекта состояла в том, чтобы собрать данные с двух разных форумов сабреддитов (оба имеют определенное сходство) и определить, пришло ли сообщение с этого конкретного форума. Для этого я использовал методы обработки естественного языка (NLP), а также набор инструментов NLTK. В этом посте я подробно расскажу о проекте и его проблемах. Для начала я выбрал 2 форума сабреддита — ролики и ролики — и использовал их в качестве входных данных для своей функции парсинга веб-страниц. Я..