Публикации по теме 'computer-vision'


Алгоритмическая базовая линия задачи разновременного городского развития SpaceNet 7
Алгоритмическая базовая линия задачи развития городов SpaceNet 7 с разным временным интервалом Предисловие: SpaceNet LLC - это некоммерческая организация, деятельность которой направлена ​​на ускорение прикладных исследований с открытым исходным кодом и искусственного интеллекта для геопространственных приложений, в частности, фундаментального картографирования (т. е. обнаружения следов зданий и дорожных сетей). SpaceNet управляется в сотрудничестве соучредителем и управляющим..

Визуальный осмотр ИИ | Дифференцированный сервис для обрабатывающей промышленности| Облако Google
Фон: Индустрия 4.0 кардинально меняет способы производства, улучшения и доставки продукции компаниями. Производители интегрируют передовые новые технологии, включая Интернет вещей (IoT), граничные вычисления, искусственный интеллект и машинное обучение, в свои производственные мощности и во все операции. Качество производства и Доходность  — два основных показателя эффективности в отрасли. Плохой контроль качества производства приводит к значительным операционным и финансовым..

RFBNet: обучение пользовательскому обнаружению объектов с 6 строками кода
Упрощение компьютерного зрения с помощью Monk, инструмента глубокого обучения с низким кодом и унифицированной оболочки для компьютерного зрения. В предыдущей статье мы создали специальный детектор объектов с использованием RetinaNet Monk . В этой статье мы построим систему наблюдения за воздушным движением на малых высотах, используя RFBNet Monk , построенную на основе PyTorch RFBNet . Давайте начнем!! Оглавление Сбор данных Преобразовать в формат COCO Модель..

Распознавание объектов и обработка переобучения для набора данных изображений CIFAR-10
В этом уроке мы исследуем производительность распознавания объектов с использованием набора данных CIFAR10 . В этом проекте мы будем использовать сверточную нейронную сеть и рассмотрим несколько новых важных терминов. Сверточная нейронная сеть (CNN) — это сильный алгоритм в области машинного обучения. Вокруг нас много сетей, но их особое свойство заключается в том, что они могут определять особенности изображения или данных для каждого класса самостоятельно. Традиционная нейронная..

Ускорение обучения ResNet-50 на IPU: за нашим тестом MLPerf
Техническое руководство по эффективному аппаратному масштабированию, стратегиям оптимизации памяти и инструментам повышения производительности. Автор: Dr. Марио Майкл Крелл , Чжэньинг Лю, Эммануэль Менаж и Бартош Богдански Инженеры Graphcore продемонстрировали выдающуюся производительность в соответствии с последними результатами обучения MLPerf v1.1, опубликованными в декабре 2021 года [9], при этом наш IPU-POD16 превзошел флагман Nvidia DGX A100 на ResNet-50. Здесь мы объясним,..

Еженедельный обзор arXiv #9
Приветствую, Среднее сообщество, В этом выпуске представлены публикации, опубликованные на arXiv с 20 по 26 мая, и представлены идеи и анализ наиболее значимых исследований и тенденций. Давайте погрузимся! Делаем Vision Transformers действительно Shift-эквивариантными Делаем визуальные трансформеры инвариантными к сдвигу. Несмотря на то, что они были вдохновлены сверточно-нейронными сетями (CNN), ViT остаются чувствительными к небольшим сдвигам во входном изображении. Чтобы..

5 моделей для создания субтитров к изображениям
Если вы начинаете работать над задачей создания подписей к изображениям и не знаете, что попробовать и с чего начать, эта история для вас. Если вы хотите получить обзор этой задачи, это тоже для вас. Я проиллюстрирую архитектуру каждой модели и предоставлю ссылки на код и статью. Что такое задача подписи к изображению? Проще говоря, я могу сказать, что он направлен на создание описания каждого изображения с помощью модели машинного обучения. Эта задача дает модели высокоуровневое..