Публикации по теме 'computer-vision'
Мягкий запуск продукта AI / ML в качестве индивидуального основателя
Мягкий запуск продукта AI / ML в качестве индивидуального основателя
Технический подробный обзор того, как я создал Print Nanny, который использует компьютерное зрение для автоматического обнаружения сбоев 3D-печати.
Технические подробности о том, как я создал Print Nanny , который использует компьютерное зрение для автоматического обнаружения сбоев 3D-печати. Я расскажу о каждом этапе разработки: от минимально жизнеспособного прототипа до масштабирования для удовлетворения..
Автоматический анализ изображений с помощью IIIF
Использование искусственного интеллекта для массового анализа изображений
В этой статье мы покажем, как использовать API-интерфейсы IIIF Presentation и Image для сбора входных данных, в том числе:
Поиск интересных изображений Распознавание изображений и автоматическая маркировка Цветовой анализ Поиск похожих изображений Срок извлечения Лучший API для анализа изображений
И мы покажем интересные, ценные, а иногда и забавные результаты этих методов для массового анализа изображений...
Аннотации данных и их роль в машинном обучении
В настоящее время технология является высшим требованием. Самыми новыми технологиями, которые распространяются практически во всех секторах, являются AI и ML. Поэтому для управления и работы всех этих машин и процессоров требуется огромное количество данных. Здесь идет аннотация данных.
Что такое аннотация данных?
Аннотация данных — это маркировка данных, которые поступают в различных форматах, таких как видео, изображения и текст. Аннотации данных — это лучший процессор для..
Создание MobileNet с нуля с использованием TensorFlow
Создание архитектуры MobileNet с нуля в TensorFlow
Ранее я обсуждал архитектуру MobileNet и ее наиболее важный уровень Глубоко разделяемые свертки в рассказе Понимание глубинно разделяемых сверток и эффективности мобильных сетей .
Далее мы увидим, как реализовать эту архитектуру с нуля с помощью TensorFlow.
Выполнение:
На рисунке 2 показана архитектура MobileNet, которую мы реализуем в коде. Сеть начинается с блока Vonv, BatchNorm, ReLU и следует за несколькими блоками..
Как решения компьютерного зрения на основе машинного обучения решают проблемы во всех отраслях
Технологии компьютерного зрения используются предприятиями для решения реальных бизнес-задач. Интеграция компьютерного зрения с технологиями приема данных помогает добиться того же. Такие секторы, как розничная торговля, финансовые услуги, страхование, автомобилестроение, СМИ и здравоохранение, развернули компьютерное зрение и машинное обучение для решения своих бизнес-задач.
Сценарии использования в разных отраслях интригуют. Например, страховые компании использовали компьютерное..
Сумка визуальных слов в двух словах
Искусство выбирать важные черты
Пакет визуальных слов (BOVW) обычно используется при классификации изображений. Его концепция заимствована из поиска информации и словарного запаса НЛП (BOW). В пакете слов (BOW) мы подсчитываем количество каждого слова, встречающегося в документе, используем частоту каждого слова, чтобы узнать ключевые слова документа, и строим из него частотную гистограмму. Мы относимся к документу как к мешку слов (ЛУК). У нас та же концепция в пакете визуальных..
Понимание Fast R-CNN и Faster R-CNN для обнаружения объектов.
Давайте подробно разберемся с этими современными сверточными нейронными сетями, основанными на предложении регионов.
Я подробно обсуждал обнаружение объектов и R-CNN в своей предыдущей статье. Вы можете прочитать это здесь , чтобы лучше понимать.
Необходимо знать об этих современных моделях обнаружения объектов, которые развивались с течением времени и теперь считаются прочной основой для гораздо более мощных сетей, существующих сегодня.
Давайте углубимся в тему.
Итак, у..