«Perl был разработан, чтобы работать больше как естественный язык. Это немного сложнее, но есть больше ярлыков, и как только вы выучите язык, он станет более выразительным. "

Когда я впервые услышал о термине Обработка естественного языка, я подумал: Подождите, что… .. как это возможно, что машины могут понимать и интерпретировать то, что мы говорим. Затем, после нескольких поисков в Google, я понял, что это не что иное, как много текстовых данных и математики.

Обработка естественного языка делится на: -

  • Морфологический и лексический анализ.
  • Синтаксический анализ.
  • Семантический анализ.
  • Анализ настроений.
  • Прагматический анализ.

Итак, сегодня мы поговорим о самом простом «анализе настроений».

Анализ настроений - это метод анализа, позволяющий получить эмоции человека по написанному им тексту.

Eg:-

«Это место нехорошее». Эта строка имеет негативное отношение.

«Это хорошее место» вызывает положительные эмоции.

Поэтому прогнозирование этих настроений называется анализом настроений. Это может быть больше типов, таких как счастливый или несчастливый, счастливый, сердитый или удивленный.

Переходя к практической части: -

  1. Предварительная обработка данных для Обработки естественного языка состоит из различных этапов: -

→ Во-первых, это сбор данных.

→ Удаление знаков препинания в тексте. Но удаление знаков препинания не всегда хорошо, потому что оно также несет в себе эмоции в тексте, поэтому это полностью зависит от пользователя и данных, что он представляет.

→ Удаление стоп-слов из текста, таких как «и, или, и т. Д.», Так как это не несет с собой никакого смысла.

→ Основа данных. Основа текста: «Стебли удаляют морфологические аффиксы из слов, оставляя только слово основа».

например: - Работа, Работа, Работа → (Выделение) → Работа.

здесь вы можете видеть, что все слова несут в себе одно и то же значение, поэтому включение всех терминов в наш словарь замедлит нашу модель, вместо этого мы можем ограничить слова и заменить их соответствующими словами.

На этом предварительная обработка ваших данных завершена …….

На этом 60% вашей работы завершено.

Теперь вам нужно создать таблицу частот повторения слов в вашем тексте. Не волнуйтесь, Tfidf Vectorizer выполнит всю работу за вас в одной строке кода, просто инициализируйте его и запустите с вашими текстовыми данными.

Здесь вы создадите вашу частотную таблицу слов с тональностью, которую она несет, создадите конвейер с вашей предпочтительной техникой классификации и Tfidf Vectorizer.

Обучите модель с помощью текстовых данных и проверьте с помощью тестовых данных… .. Вот и все. :)

Мой блокнот Jupyter для этого анализа настроений: -



Не забудьте передать нам 👏!