Публикации по теме 'nlp'


Нейронный машинный перевод: превосходные модели Seq2Seq с OpenNMT
Язык составляет саму основу общения, и разве не было бы замечательно иметь единый язык, на котором все могли бы общаться? Это, безусловно, сломало бы все преграды и сплотило бы весь мир. То же самое и в фильме Прибытие , где человек-лингвист в роли Эми Адамс наделен знаниями, позволяющими понимать язык инопланетян и преодолевать даже временные барьеры. Это стоящие часы, если вы еще не смотрели их. Поскольку такой сценарий маловероятен, мы принимаем решение в Машинном переводе с..

Создание классификатора NLP: пример с отчетами о проблемах Firefox
DistilBERT против LSTM, с исследованием данных Методы машинного обучения (ML) для обработки естественного языка (NLP) в наши дни дают впечатляющие результаты. Такие библиотеки, как Keras, PyTorch и HuggingFace NLP, делают применение последних исследований и моделей в этой области (относительно) простой задачей. В этой статье я реализую и сравниваю две разные архитектуры модели классификатора на основе NLP, используя данные системы отслеживания проблем браузера Firefox. Ранее я..

Морфологическая обработка для தமிழ் - неконтролируемый способ
Это часть серии статей о НЛП для тамильского языка. Пожалуйста, найдите первую здесь . Подводя итог предыдущему посту, тамильский - это агглютинативный язык, который может образовывать сложные слова с потенциально бесконечными суффиксами. Мы определили морфологию как изучение того, как слова меняют форму, чтобы отображать вариации значения. Затем мы описали, как производную конечных автоматов, преобразователь конечного состояния (FST) можно использовать как для морфологического анализа,..

Действия IBM Watson Assistant теперь с улучшенным управлением
Действия IBM Watson Assistant теперь с улучшенным управлением С первым набегом на тонкую настройку действий Watson Assistant… в некоторой степени Введение 19 августа 2021 года была выпущена новая функция для навыков IBM Watson Assistant Action. Панель предварительного просмотра и тестирования в «Действиях» теперь включает две вкладки; отладка и переменные представления. Это приближает процесс тестирования к созданному приложению. IBM Watson Assistant Actions можно..

Модели внимания в НЛП: краткое введение
Источники: Вот сокращенная версия статьи wildml: http://www.wildml.com/2016/01/attention-and-memory-in-deep-learning-and-nlp/ Типичные модели seq2seq обычно имеют форму, описанную в моем блоге: https://medium.com/towards-data-science/sequence-to-sequence-model-introduction-and-concepts-44d9b41cd42d При использовании примера перевода с языка на язык: предполагается, что декодер сгенерирует перевод исключительно на основе последнего скрытого состояния от кодировщика. Этот вектор должен..

Как мы делаем обнаружение тишины в разговоре на основе аудиосегментации при звонках в контакт-центр
При среднем звонке в контакт-центр более 35 % звонка — это тишина, когда ни оператор, ни клиент не разговаривают. Мы называем это разговорным молчанием . Разговорное молчание состоит в основном из музыки ожидания, автоматически записанных сообщений или просто молчания, когда агент или клиент не говорит активно. Большинство этих молчаний в разговоре негативно влияют на важные KPI контакт-центра (затхлый эфир влияет на удовлетворенность клиентов, длительное время ожидания влияет на..

Сопоставление нечетких строк с Python
Подход на расстоянии Левенштейна Недавно я работал с набором данных и должен был сопоставить строки. Пришлось рассчитать процент совпадения строк. Поскольку я работал с Python, я знал, что для него должна быть библиотека. Как бы то ни было, у Python есть для этого библиотека! В информатике существует концепция, называемая нечетким сопоставлением строк. Это техника сопоставления узора из строк. Если вы написали слово с ошибкой и написали слово правильно, вы можете найти..