Публикации по теме 'nlp'


Введение в Quantyca и fast.ai
Введение в Quantyca и fast.ai Наш подход и некоторые задачи, которые мы решили с помощью пакета В начале года вместе с коллегами Quantyca , которые являются частью практикующего сообщества аналитиков, мы решили потратить часть своего времени на то, чтобы углубить наши знания о fast.ai , развивающаяся библиотека глубокого обучения, разработанная на базе PyTorch . Поэтому мы сформировали исследовательскую группу, открытую также для коллег из других центров компетенции (SRE,..

Мультиклассовая классификация текста с использованием PySpark, MLlib и Doc2Vec
Машинное обучение , Программирование , Python Мультиклассовая классификация текста с использованием PySpark, MLlib и Doc2Vec Как использовать Apache Spark MLlib с PySpark для проблем NLP и как моделировать Doc2Vec в Spark MLlib Apache Spark сегодня довольно популярен для масштабирования любого приложения для обработки данных. Для машинного обучения также имеется библиотека под названием MLlib . Это подход распределенного программирования для решения проблем машинного..

Адаптация ответов на вопросы BERT для медицинской области
BERT, одна из революционных моделей в НЛП прошлого года, изменила способ работы с текстовыми данными. Несмотря на то, что он превзошел современные результаты для широкого круга задач НЛП, некоторые вопросы, связанные с его адаптацией к предметной области и расширением для задачи ответа на вопросы, все еще не исследованы. Эта статья призвана обобщить исследования, проведенные во время летней стажировки в Peltarion , чтобы адаптировать BERT к ограниченному количеству наборов данных по..

Элементы понимания теории множеств #1. Введение
Математическое пространство Математическое пространство — это совокупность объектов с определенной над ними структурой. Это определение в целом, а также используемые в нем слова и их отношения могут показаться слишком расплывчатыми, широкими и двусмысленными. Что такое «объект»? Что такое «коллекция» и «структура»? Почему структура «определена», а не принадлежит этим объектам или их коллекции? И если он определен, то кто и почему определяет его? Вместо того чтобы интуитивно..

Как спутники узнают, где искать?
Социальные сети приносят пользу спутниковым системам оповещения благодаря обработке естественного языка Представьте себе спутник, вращающийся вокруг земного шара, незаметно делающий снимки земных океанов и городов, чтобы охватить весь мир, часто менее чем за час. Сейчас почти 2000 спутников работают в таком темпе, обеспечивая изображения с более высоким разрешением и большей скоростью, чем когда-либо прежде. По мере того, как данные из космоса становятся все более разнообразными, а..

Развитие машинного обучения со временем
Машинное обучение по-прежнему находится на переднем крае создания технологий и будет продолжать расти и расти, прогрессируя быстрее, чем мы понимаем, в недалеком будущем. Машинное обучение влияет на потенциал каждого бизнеса и каждого человека. Машинное обучение может стать модным мотивом в эпоху искусственного интеллекта. Мы видим в нашей собственной жизни более широкое использование распознавания лиц в наших телефонах, приложениях для интерпретации диалектов, беспилотных автомобилях и т...

Исправление ввода текста с помощью машинного перевода и классификации
В последнее время я работаю над проектом, связанным с оптическим распознаванием символов (OCR). Одна из проблем заключается в том, что предварительно обученная модель OCR выводит неверный текст. Помимо производительности модели OCR, другим важным источником ошибок текста являются качество изображения и выравнивание макета. Прочитав этот пост, вы поймете: Тип ошибки оптического распознавания символов На основе лексикона На основе содержания Статистический машинный перевод..