Публикации по теме 'nlp'


Как получить высокий балл с помощью MMBT и CLIP в конкурсе Hateful Memes Competition
Используйте CLIP в качестве кодировщика функций для Multimodal Bitransformer и заставьте MMBT действительно работать с Huggingface Transformers, чтобы получить удивительно высокую точность Дополнительный этап конкурса Hateful Memes Competition от Facebook завершился несколько месяцев назад. Моей команде посчастливилось поучаствовать в этом соревновании и даже получить неплохие результаты (мы заняли десятое место). Как мы это сделали и какие методы использовали - расскажу в этой..

ИИ: создайте свою первую модель машинного обучения (часть 1 из 2)
ИИ: создайте свою первую модель машинного обучения (часть 1 из 2) Воспользуйтесь бесплатными инструментами, чтобы создать свою первую модель машинного обучения! Сначала мы формируем наши инструменты «Мы формируем наши инструменты, а затем наши инструменты формируют нас» — Маршалл Маклюэн Запуск вашего самого первого проекта ИИ может показаться пугающим, особенно если вы не знаете, с чего начинать. Этот краткий учебник шаг за шагом проведет вас через процесс создания..

Сверточная сеть с текстовыми графами - Классификация книг Библии
Подход на основе графа с полуконтролем для классификации и вывода текста В этой статье я подробно расскажу о текстовой сверточной сети графов (GCN) и ее реализации с использованием PyTorch и стандартных библиотек. Модель GCN на основе текста - это интересная и новая современная концепция полууправляемого обучения, которая была предложена недавно (расширяя предыдущую идею GCN компанией Kipf et al . на нетекстовых данных), который может очень точно вывести метки некоторых..

Обработка естественного языка - Анализ зависимостей
Практические руководства Обработка естественного языка - Анализ зависимостей Различные способы анализа зависимостей с использованием spaCy, NLTK с Stanford CoreNLP и Stanza Что такое анализ зависимостей? Анализ зависимостей - это процесс анализа грамматической структуры предложения и выяснения связанных слов, а также типа связи между ними. Каждые отношения: Имеет одну голову и зависимую , изменяющую голову . Обозначается в соответствии с характером зависимости между..

Мой дневник машинного обучения: день 74
Сегодня я узнал о языковой модели. Языковая модель Языковая модель — это распределение вероятностей по последовательности слов. Модель может вычислить вероятность того, что она выдаст конкретное предложение. Например, первая единица RNN даст нам вероятностное распределение по словарю, а именно, P(a), P(aaron), …, P(zulu), P(‹UNK›), P(‹EOL› ). (‹UNK› обозначает слово, которого нет в словаре, а ‹EOL› обозначает конец предложения.) Мы можем обучить модель с большим набором..

Обработка естественного языка: компьютер понимает людей!
Обработка естественного языка (NLP) — это область искусственного интеллекта, связанная с взаимодействием между компьютерами и человеческим языком. Цель НЛП — иметь возможность обрабатывать и обрабатывать нюансы языка внутри них. В некотором смысле мы хотим, чтобы компьютер был способен «понимать» содержание документов, включая контекстуальные нюансы. Круто правда? Но как нам это сделать? В этой области было проведено множество исследований, и сегодня существует множество..

Анализ документа - это больше, чем обработка текста
Нетрудно понять, почему компании хотят использовать технологии для работы с документами. Учитывая огромный и постоянно растущий объем документов, которые необходимо обработать, машинная помощь неизбежна. А машинный анализ показал большую эффективность во всем: от обработки медицинских записей и страховых требований до обнаружения мошенничества в электронных письмах. Однако успех любого конкретного проекта обработки документов далеко не предопределен. Те, кто думает о своих документах..