Вы когда-нибудь писали обзор из 10 абзацев на Amazon, потому что чувствовали себя настолько неудовлетворенными конкретным продуктом? Как вы думаете, есть ли кто-то в офисе Amazon прямо сейчас, читающий ваши отзывы и точно знающий, что вы чувствуете? С современными технологиями и окружающей средой компании могут собирать тысячи отзывов клиентов. Тем не менее, для простых людей по-прежнему невозможно проанализировать его вручную без какой-либо ошибки или предвзятости.

Анализ настроений — это контекстный анализ текста, который идентифицирует и извлекает субъективную информацию из исходного материала и помогает бизнесу понять социальные настроения своего бренда, продукта или услуги при мониторинге онлайн-разговоров.

В этом коротком проекте (репозиторий GitHub) я собираюсь показать вам, как анализировать настроения клиентов, которые используют Amazon Alexa, с помощью VADER.

VADER (Valence Aware Dictionary and sEntiment Reasoner) — это основанный на лексике и правилах инструмент анализа настроений, который специально настроен на настроения, выраженные в социальных сетях и отзывах клиентов. VADER используется для количественной оценки количества положительных или отрицательных эмоций в тексте, а также их интенсивности. Он не требует никаких обучающих данных. Кроме того, VADER может понимать смысл текста, содержащего смайлики, сленг, союзы, заглавные слова, знаки препинания и многое другое, поэтому он очень хорошо работает с текстом в социальных сетях. Чтобы вычислить сентиментальную оценку всего текста, VADER сканирует текст на наличие известных сентиментальных признаков, изменяет интенсивность и полярность в соответствии с правилами, суммирует оценки признаков, найденных в тексте, и нормализует окончательную оценку до -1 (самая крайняя степень). отрицательный) и +1 (наиболее положительный).

Начнем с импорта необходимых библиотек и пакетов.

Набор данных, который я использую для анализа тональности отзывов Amazon Alexa, был собран с Kaggle. Он содержит данные об оценках от 1 до 5, дате отзывов и отзывах клиентов об их опыте использования различных продуктов Alexa.

Столбец рейтинга набора данных содержит оценки, данные пользователями Amazon Alexa по шкале от 1 до 5, где 5 — это лучшая оценка, которую может дать пользователь.

Из приведенного выше рисунка видно, что большинство клиентов оценили свою Amazon Alexa на «5». Таким образом, это означает, что большинство клиентов довольны этим продуктом.

Теперь давайте перейдем к задаче анализа тональности отзывов Alexa. Столбец «verified_reviews» набора данных содержит все отзывы, оставленные клиентами Amazon Alexa. Итак, давайте добавим к этим данным новые столбцы как положительные, отрицательные, нейтральные и составные, рассчитав оценки тональности отзывов:

В целом, клиенты имеют опыт работы с Amazon Alexa от нейтрального до отличного, более 1000 отзывов положительные и только около 97 из 3150 отзывов отрицательные.

Наконец, давайте посмотрим на составной балл для положительных и отрицательных меток.

Как видно из приведенной выше диаграммы, положительные метки достигли гораздо более высокого сложного балла, и большинство из них выше 0,5. Отрицательные метки получили более низкий составной балл, но он довольно нейтральный со средним значением и медианой около 0.

В заключение, анализ настроений помогает компаниям улучшить обслуживание клиентов и продукты, поскольку он может дать им представление об эмоциях и уровне удовлетворенности своих клиентов. Если вам понравился этот пост, также ознакомьтесь с TEDx Talk Энди Кима об использовании возможностей машинного обучения для анализа человеческого общения.