Наша цель - превратить данные в информацию, а информацию - в понимание

Когда текстовые данные начинают играть роль в мире науки о данных, люди получают так много скрытых корзин информации, которые у них есть, и мы должны раскрыть ценность для бизнеса в неструктурированных данных, преобразовав их в полуструктурированные или структурированные данные. Поиск контекстной информации на основе сущностей, существующих в текстовых данных.

Важную роль в этом играет деятельность по распознаванию именованных сущностей. Используя некоторые стандартные библиотеки, такие как NLTK, spaCy, мы можем выполнить эту задачу. Но Google Cloud Platform также предоставляет свой естественный язык API для распознавания сущностей и дальнейших процессов, таких как анализ тональности, синтаксический анализ и т. Д.

В этом руководстве мы увидим, как использовать Google Cloud Natural Language API для анализа сущностей и настроений сущностей в текстовых данных. Этот процесс помогает специалистам по обработке данных продолжить обработку текстовых данных в случае классификации контента для поставщиков новостей, в поисковых алгоритмах, при создании приложений поддержки клиентов для эффективного распознавания отзывов и т. Д.

Настройка проекта консоли Google Cloud Platform, создание учетных данных, настройка переменной среды подробно описаны в моем предыдущем руководстве Анализ настроений с помощью Google Cloud Natural Language API.

Анализ сущности

Теперь, чтобы проанализировать сущности, мы должны вызвать метод analysisEntities. Ниже приведен пример кода в Node.js.

Это даст результаты, как показано ниже.

Он распознает такие объекты, как человек, организация, местоположение, другое, событие, дата, по категориям, таким как ЛИЦО, ОРГАНИЗАЦИЯ, МЕСТО, ДРУГОЕ, СОБЫТИЕ, ДАТА. Каждая сущность описывается в смысле имени, типа, метаданных, значимости, упоминаний и настроения.

Анализ настроений организаций

Анализ настроений сущности представляет собой смесь анализа сущности и анализа настроений. Полезно знать, как определенная сущность выражает свои чувства в тексте.

Это пример кода, написанного на Node.js для анализа настроений сущностей.

Это даст результаты, как показано ниже.

В результатах мы видим, что для сущностей представлены те же критерии информации, что и в результатах метода analysisEntities, но, кроме того, здесь мы получаем числовые значения и величины. Эта величина и оценка отражают настроение объекта, связанное с каждым его упоминанием.

Наконец, мы узнали, как выполнять анализ сущностей и настроений сущностей с помощью Google Cloud Natural Language API. Увидимся в следующем уроке.

Удачного обучения !!!