Публикации по теме 'text-analytics'


Распознавание именованных сущностей: приложения и сценарии использования
Распознавание именованных сущностей - это процесс, в котором алгоритм принимает строку текста (предложение или абзац) в качестве входных данных и определяет соответствующие существительные (люди, места и организации), которые упоминаются в этой строке. В нашем предыдущем блоге мы познакомили вас с тем, как работает наш API распознавания именованных сущностей . В этом посте мы перечисляем некоторые сценарии и варианты использования технологии распознавания именованных сущностей...

Организация вашего первого проекта текстовой аналитики
Использование инструментов естественного языка для обнаружения разговорных данных. Анализ текста или интеллектуальный анализ текста - это анализ «неструктурированных» данных, содержащихся в тексте на естественном языке, с использованием различных методов, инструментов и приемов. Популярность интеллектуального анализа текста сегодня обусловлена ​​статистикой и доступностью неструктурированных данных. С ростом популярности социальных сетей и с учетом того, что Интернет является..

Обозначение тем: руководство для начинающих.
Маркировка тем — это метод машинного обучения и НЛП, который помогает извлекать смысл из большого объема неструктурированных текстов на основе повторяющихся тем или тем. Компании ежедневно генерируют большой объем документов и неструктурированного текста, таких как сообщения в социальных сетях, электронные письма, обсуждения на форумах, обзоры и запросы в службу поддержки клиентов. Но когда дело доходит до анализа и осмысления этих данных, их слишком много, чтобы обрабатывать их..

Не оставайтесь позади: как неструктурированные данные могут дать вам конкурентное преимущество
Инвестиции в инструменты искусственного интеллекта и развитие талантов Позвольте мне предварить это эссе утверждением: "Если вы занимаетесь бизнес-аналитикой и не используете полностью неструктурированные данные, которые уже доступны вам, не говоря уже о том, что там есть, вы упускаете …

Мы просто болтунья. Кенийский социальный ритм 2019 года
Чаще всего я слишком много думаю о Кении, моей родине. Я думаю о том, насколько амбициозны, иногда воинственны и часто добрые люди в целом. Не уверен, что Мигуна Мигуна подпадает под этот критерий, но, вероятно, да, в своем праве. Это дало мне идею придумать перспективное описание нашей природы как кенийцев, по крайней мере, на 2019 год. На самом деле это возникло, когда я серьезно подумал о своей жизни на борту самолета Боинг 717, выполнявшего рейс Гонолулу - Кахулуи, Мауи, для..

ИИ в обработке текста и естественного языка — Основы, часть 2
В предыдущем блоге мы видели, как очищать текст, и теперь мы перейдем к извлечению признаков, то есть к преобразованию текста в векторы чисел, которые могут быть прочитаны машиной. Давайте сосредоточимся на нескольких важных методах извлечения признаков. Если мы хотим предсказать цену дома, нам потребуются определенные характеристики, связанные с этим домом, такие как местность, площадь дома, расстояние от школ, больниц, материалы, использованные в строительстве и т. д. Они могут..

Преодоление ограничений тематических моделей с помощью полууправляемого подхода
(Похожие сообщения: Введение в тематические модели для анализа текста , Осмысление тематических моделей , Интерпретация и проверка тематических моделей , Как передискретизация ключевых слов может помочь в анализе текста. И Насколько надежны или полезны тематические модели? ) В двух предыдущих сообщениях в этом блоге я представил тематические модели и исследовал некоторые трудности , которые могут возникнуть, когда исследователи пытаются использовать их для измерения..