Публикации по теме nlp

Публикации по теме 'nlp'

Передовой семантический поиск и схожесть предложений

Семантический поиск - сложная задача, которую стоит решить в НЛП. Обычно мы тратим много времени на поиск определенной информации в большом документе. И мы обычно находим, используя CTRL + F. Пресловутый гугл-фу, искусство эффективного поиска информации в гугле, является ценным навыком на рабочем месте 21-го века. Нам доступны все человеческие знания, для этого нужно задать правильный вопрос и знать, как пролистывать результаты, чтобы найти соответствующий ответ. Наш мозг выполняет..

Brave Times на 2-й летней школе разговорного интеллекта

В этом посте мы ( Beatriz и Estêvão ), оба специалиста по данным из DataLab Serasa Experian , поделимся своим опытом во 2-й летней школе разговорного интеллекта , к которой у нас была возможность присоединиться в июне. Летняя школа была направлена на то, чтобы собрать вместе исследователей со всего мира, чтобы вместе учиться и обсуждать границы знаний и современного состояния (SOTA) в области разговорного интеллекта. СНПЧ и мы сами Разговорный интеллект связан с производством..

Как вести убедительные разговоры с чат-ботом

Как вести убедительные разговоры с чат-ботом Используйте эти принципы, чтобы эффективно вести диалог с чат-ботом Введение Убедитесь, что ваш чат-бот всегда выбирает и возвращает наиболее подходящий диалоговый узел… Узнайте, как подходить к построению разговорных диалогов и вести сложные разговоры. Общие советы Во-первых, прежде чем кодировать или создавать отдельный узел, спланируйте объем ваших разговоров. Запись на доске помогает команде. Не обсуждайте и впоследствии не..

Перевод песни Messing With Intents - Часть II

Более глубокий взгляд на многозначные вложения В Мессинге с переводом намерений - Часть I мы показали, как алгоритм MUSE, основанный на GAN, работает с проблемой перевода намерений. При этом мы проверили результаты Conneau et al. для проблемы перевода слов и воспроизвел результаты около 80% с P @ 1 между испанским и английским языками. P @ 1 означает, что для всех доступных известных переводов исходного слова, которое есть в словаре, оставьте его. Затем для всех возможных..

Машинное обучение, НЛП: классификация текста с данными обзора Amazon с использованием Python3, шаг за шагом…

Классификация текста - одна из активных тем исследования, называемая Обработкой естественного языка (NLP). В этой статье предлагается контролируемый способ решения этой проблемы, т. Е. Модель учится на помеченных данных. Полный исходный код, использованный в этой статье, доступен здесь . Первый шаг: сбор набора данных Amazon Review DataSet - полезный ресурс для практики. Здесь мы выбираем меньший набор данных - Одежда, обувь и украшения для демонстрации. Формат - один обзор..

[Обзор] Задача классификации токсичных комментариев Kaggle

Предварительное вскрытие Задача классификации токсичных комментариев связана с проблемой классификации текста с несколькими метками с сильно несбалансированным набором данных. Изначально выяснилось, что использованный тестовый набор уже опубликован в Интернете, поэтому новый набор данных был выпущен в середине конкурса, а метрика оценки была изменена с Log Loss на AUC . Проблема классификации токсичных комментариев Выявление и классификация токсичных..

Google Cloud Natural Language Processing API, первые шаги

Новый API обработки естественного языка : Google прилагает все усилия, чтобы предоставить облачные сервисы, которые облегчают взаимодействие человека с компьютером с помощью инструментов, которые могут использовать человеческий язык. В недавнем сообщении в блоге мы обсуждали Google Cloud Speech API , службу преобразования звуковой речи в текст . Возможно, руководствуясь аналогичной технологией, основанной на глубоких нейронных сетях (в частности, Tensorflow ), Google недавно выпустила..