Публикации по теме computer-vision

Публикации по теме 'computer-vision'

Инверсия GAN: краткое руководство — Часть I

Недавние исследования использовали генеративно-состязательные сети (GAN) для создания фотореалистичных изображений и выполнения манипуляций с изображениями. Однако для выполнения таких манипуляций с реальными изображениями требуется понимание соответствующего скрытого кода. Эта серия предназначена для объяснения концепции инверсии GAN [ 1 ], которая направлена на обеспечение интуитивного понимания скрытого пространства путем инвертирования изображения в скрытое пространство для..

Обучите ИИ распознаванию изображений с помощью 5 строк кода

В этой статье мы кратко познакомим с областью искусственного интеллекта, особенно в области компьютерного зрения, с сопутствующими проблемами, с существующими современными решениями этих проблем и с тем, как вы можете легко и удобно применять эти решения, не затрачивая много времени и усилий. Искусственный интеллект на протяжении десятилетий был областью исследований, в которой ученые и инженеры прилагали активные усилия, чтобы разгадать тайну того, как заставить машины и компьютеры..

Полное руководство по операциям с данными для ИИ

Данные — это топливо, которое питает модели AI и ML. Без достаточно качественных релевантных данных невозможно обучать и разрабатывать точные и эффективные модели. DataOps (операции с данными) в искусственном интеллекте (ИИ) — это набор методов и процессов, направленных на оптимизацию управления и потока данных на протяжении всего жизненного цикла разработки ИИ. Цель DataOps — повысить скорость, качество и надежность данных в системах ИИ. Это расширение методологии DevOps..

Понимание распознавания жестов, часть 1 (компьютерное зрение)

MoRSE: распознавание жестов рук на основе глубокого обучения для поисково-спасательных операций ( arXiv ) Автор: Панагиотис Каснесис , Христос Хацигеоргиу , Димитриос Г. Когиас , Харалампос З. Патрикакис , Харрис В. Георгиу , Аспазия Целетопулу Аннотация: Эффективная и быстрая удаленная связь в поисково-спасательных операциях может спасти жизнь тем, кто оказывает первую помощь. Однако при работе в полевых условиях средства связи на основе текста, изображения и аудио не..

StyleGAN: подробное объяснение

Генеративно-состязательные сети (GAN) дали самые современные результаты в генеративных задачах и стали одной из самых важных сред в глубоком обучении. Было предложено множество вариантов GAN для улучшения качества сгенерированных изображений или обеспечения условного синтеза. Однако до StyleGAN им еще предстоит предложить интуитивно понятное управление процедурой синтеза в зависимости от масштаба. StyleGAN — это расширение прогрессивной GAN, архитектуры, которая позволяет нам создавать..

Учебники Trueface: преобразование моделей MXNet для работы с высокопроизводительными фреймворками вывода

Здесь, в Trueface, мы используем MXNet для обучения наших моделей машинного обучения. MXNet - отличный фреймворк, когда дело доходит до прототипирования и обучения, благодаря надежному и простому в использовании API, который позволяет разработчикам любого уровня подготовки приступить к работе всего с нескольких строк кода. Однако, когда приходит время развертывать наше программное обеспечение в инфраструктуре клиентов, мы часто сталкиваемся с ограничениями памяти и ЦП из-за..

IncepText: новый инструмент распознавания текста Alibaba с орлиным взглядом

Эта статья является частью серии Academic Alibaba и взята из статьи Qiangpeng Yang под названием Новый модуль начального текста с деформируемым объединением PSROI для многонаправленного обнаружения текста сцены . , Mengli Cheng, Wenmeng Zhou, Yan Chen, Minghui Qiu, Wei Lin и Wei Chu, принятые IJCAI 2018. Полностью статью можно прочитать здесь . Обнаружение текста сцены — расшифровка текста, который появляется в окружающей среде непосредственно из видеозаписи с камеры — является..