Публикации по теме 'nlp'


Использование Core ML и естественного языка для анализа настроений на iOS
Классификация обзоров IMBD на устройстве в Swift Анализ настроений (SA) относится к использованию обработки естественного языка (NLP) для систематической идентификации, извлечения, количественной оценки и изучения аффективных состояний и субъективной информации. Источник Представьте, что вы только что запустили новую рекламную кампанию или новый продукт, как в новом фильме Диснея «Король Лев», и хотите иметь четкое представление о том, что люди думают о фильме. В этом может..

Регулярные выражения в Python
Regex для науки о данных Регулярные выражения - это специальные последовательности символов, которые определяют шаблоны поиска в текстах. В этом посте мы обсудим, как использовать один из самых основных методов регулярных выражений в Python, «re.findall ()», для извлечения начала строковых выражений. Давайте начнем! Для начала давайте импортируем модуль регулярных выражений python «re»: import re Предположим, у нас есть следующая строка: test_string1 = 'Python is Amazing!'..

Вуаля! Дебют французской языковой модели SOTA CamemBERT
Французский язык имеет долгую историю в качестве основного или второго языка в Организации Объединенных Наций, Европейском Союзе, на Олимпийских играх и в бесчисленном множестве других международных арен и организаций. Тем не менее, доля исследований в области обработки естественного языка (НЛП) в сообществе машинного обучения, сосредоточенных на языке Вольтера, остается относительно небольшой. Теперь команда из Facebook AI Research, Inria и Sorbonne Université выпустила CamemBERT, по..

Классификация многоязычных документов
Классификация многоязычных документов Как создать приложение НЛП, не зависящее от языка. Использование неструктурированных данных становится обязательным условием для поддержки и развития бизнеса, основанного на данных. Разработка текстовых функций, которые могут улучшить производительность модели NLP , требует сочетания лингвистики, науки о данных и опыта в области бизнеса. Этого достаточно для стартапа, но как насчет того, чтобы ваш продукт стал вирусным и вы выйдете на мировой..

Основные функции spaCy: сравнение производительности для португальского, французского и английского языков
С июня 2020 г. я больше не буду использовать Medium для публикации новых историй. Пожалуйста, посетите мой личный блог, если вы хотите продолжить читать мои статьи: https://vallant.in . spaCy — отличный инструмент для НЛП. Библиотека с открытым исходным кодом бесплатна, быстра и проста в использовании. У spaCy также есть замечательные функции, такие как тот факт, что он использует неразрушающую токенизацию и поддерживает множество языков. Но мы знаем, как тяжело работать с..

Обучающие вложения предложений с помощью логического вывода
Подход к неконтролируемому обучению кажется нормальным способом построения вложений слов, предложений или документов, потому что он более обобщен, так что предварительно обученный результат встраивания может быть передан другим нисходящим задачам НЛП. Например, пропустить грамму при встраивании слов и пропустить при встраивании предложений и распределенный мешок слов при встраивании абзацев. Conneau et al. отметил, что контролируемое обучение в ImageNet (классификация изображений)..

Руководство по обобщению текста: исследовательский анализ текстовых данных
Часть 1 из серии о реферировании текста с помощью методов машинного обучения Во время выполнения моего краеугольного проекта в программе Machine Learning Engineer Nanodegree в Udacity я довольно глубоко изучил проблему реферирования текста. По этой причине я собираюсь написать об этом серию статей , от определения проблемы до некоторых подходов к ее решению, показывая некоторые базовые реализации и алгоритмы, а также описывая и тестируя некоторые более продвинутые методы. . Это..