Публикации по теме 'nlp'


Извлечение информации из новостей Банка Англии
Автор Анзор Гозалишвили Введение Банковские новости очень важны для отслеживания последних изменений акций. Это очень важная проблема, поскольку бизнес-решения зависят от этих цифр. Автоматизация этих решений может быть очень полезна для многих банков и организаций. Проблема Данный образец новостей банка Англии с его веб-сайта: Требуется извлечение показателей банковской ставки и количественного смягчения (QE). Банковская ставка: 0,75%, количественное смягчение: нет данных...

Визуализация 100000 продуктов Amazon
Быстрое встраивание предложений (fse) позволяет вычислить вложения предложений для миллионов отзывов всего за несколько минут. Код fse в этой статье может быть объявлен устаревшим. Обязательно используйте обновленный код, как указано на Github . Вступление Во время учебы в аспирантуре я регулярно работаю с встраиванием предложений. В частности, я работаю со средними [1] и гладкими обратными частотными (SIF) [2] вложениями. Хотя оригинальные реализации на Github весьма..

Особенности классификации тональности коротких текстов
Разработка функций для классификации тональности коротких текстов в НЛП В этой статье ( Функции на основе лексики тональности для анализа тональности в кратком тексте ) рассказывается о многих функциях, которые могут помочь в понимании ориентации слов как на синтаксическом, так и на семантическом уровнях для определения тональности данного фрагмента. короткого текста. Ниже приводится краткий обзор каждого из них - Word n-граммы - авторская игра и извлечение элементов..

Перекрестная проверка - почему и как
Итак, вы работаете над несбалансированным набором данных уже несколько дней и пробуете различные модели машинного обучения, тренируете их на части вашего набора данных, проверяете их точность, и вы в восторге от того, что каждый раз набирает балл выше 0,95. время. Вы действительно думаете, что достигли точности 95% с вашей моделью? Необходимость оценки Я предполагаю, что вы выполнили первоклассную предварительную обработку своего набора данных, а также удалили все отсутствующие..

Обзор многоязычного перевода с нулевым переводом
Введение в многоязычный нейронный машинный перевод с Zero Shot Training В моем предыдущем блоге мы узнали, что представляет собой система машинного перевода. Там мы узнали, как создать нашу собственную систему машинного перевода между двумя языками, используя нейронный машинный перевод. Однако в этой статье мы увидим, как с помощью многоязычного машинного перевода создать единую модель, которая понимает разные языковые пары. Мы рассмотрим различные подходы к многоязычному..

Анализ главных компонентов (PCA)
Что это? PCA можно рассматривать как математический трюк, часто применяемый для оптимизации систем машинного обучения. Имея дело с векторами, которые слишком велики/имеют слишком высокую размерность для использования в вычислениях, мы можем определить, какие измерения захватывают наибольшее количество информации о векторе, и спроецировать каждый вектор на эти измерения. В контексте НЛП векторы представляют собой встраивания слов. Таким образом, при использовании PCA в системе NLP мы..

Как сделать автоматический теггер с помощью классификатора с несколькими ярлыками - Часть 1
Многопозиционная классификация для НЛП в Python Введение Классификация с несколькими метками - это тип проблемы, когда каждому объекту назначается набор из одной или нескольких целевых меток. Это очень похоже на предсказание жанров фильма или песни. Фильм или песня могут иметь один или несколько жанров одновременно, и эти целевые лейблы не обязательно должны быть взаимоисключающими. Мотивация Вы наверняка сталкивались с StackOverflow . Вы когда-нибудь задумывались о том,..