Публикации по теме 'nlp'


Масштабирование подобия пространственного текста (NLP) в Apache Spark
В этой статье мы узнаем, что такое Spacy и как мы можем использовать Apache Spark для масштабного запуска Spacy. В связи с постоянно растущим спросом на варианты использования машинного обучения в повседневном бизнесе потребность в различных типах алгоритмов машинного обучения в различных областях растет с постоянно растущим объемом данных. Что такое Spacy Spacy - это промышленная библиотека обработки естественного языка для обработки текстовых данных для машинного обучения,..

Автоматическое обнаружение сигналов из будущего с помощью Python и NLP
Давайте представим, что вы способны знать, что и когда что-то произойдет. Вы можете просто инвестировать в фондовый рынок и стать миллионером или просто предпринять упреждающие действия, чтобы исправить свои фьючерсные ошибки. Круто, да? В этой статье мы попытаемся обнаружить слабые сигналы, исходящие из разных документов, и выяснить, какие из них могут стать актуальными и повлиять на будущее. Результатом будет микросервис python и панель мониторинга с использованием Redash ...

Комплексный проект по классификатору спама - от обучения до развертывания🚀
Сквозной проект НЛП до развертывания Согласно статье в Forbes, мы производим около 2,5 квинтиллионов байтов данных каждый день, и в следующие пять лет эти цифры увеличатся до 5 раз. Из этого огромного количества данных почти 90% данных без ярлыков и бесполезны. Это бесполезно, потому что мы не знаем, как им пользоваться. Здесь выступают специалисты по анализу данных и эксперты по машинному обучению. Специалист по данным имеет все возможности преобразовать эти непригодные для..

Анализ настроений в обзорах фильмов, часть 1
Часть 1 — Основы ссылка на мой Github для получения дополнительного кода: https://github.com/charliezcr/Sentiment-Analysis-of-Movie-Reviews/blob/main/sa_p1.ipynb Когда у вас есть большое количество обзоров фильмов, как вы можете узнать, являются ли они комплиментами или критическими замечаниями? Поскольку объем набора данных велик, вы не можете аннотировать их один за другим, а должны использовать инструменты обработки естественного языка для классификации тональности текста. Особенно..

Использование RoBERTa с Fastai для SuperGLUE Task CB
Тонкая настройка современного RoBERTa с помощью fast.ai по задаче Commitment Bank NLP. Это руководство будет во многом основываться на моей предыдущей работе по использованию Roberta с fast.ai для анализа настроений IMDB . Мы просто изменим наш предыдущий код, чтобы проанализировать данные и настроить соответствующую модель Роберты для задачи SuperGLUE, CB. Это руководство также можно применить к другим задачам BoolQ и RTE с небольшими изменениями. Обновление 2020.11: fast.ai..

Размещение в блоге дипломной работы 4: Невероятно простая адаптация предметной области (и связанные с ней проблемы)
В серии постов, обобщающих мою кандидатскую диссертацию «Адаптация предметной области для нейромашинного перевода», здесь я рассказываю о своей работе по простой адаптации нейронных сетей к новым данным. Возможно, самый простой способ адаптировать любую нейронную сеть — просто продолжить ее обучение, но на новом наборе данных. Для машинного перевода это новые пары предложений: примеры предложений и их переводы. Возможно, вы хотите, чтобы ваша система перевода новостей могла переводить..

Как они читают ваши мысли ?
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА (ЧАСТЬ III) Нижеследующее является частью серии статей по НЛП. (Отметьте Часть I и Часть II ) Вы когда-нибудь задумывались, как Spotify Discover Weekly может каждую неделю предоставлять вам настраиваемый плейлист, который соответствует вашим вкусам? Вы когда-нибудь искали видео и находили именно то, что искали, в списке рекомендуемых видео на YouTube? Разве не впечатляет то, что ваш любимый новостной веб-сайт предоставляет вам статьи, которые вас..