Публикации по теме 'computer-vision'


Использование 3D-камер для отслеживания социального дистанцирования
Объединив стереокамеры ZED с динамиками Echo Dot, вы можете создать экономичную систему сигнализации AI, которая поможет вам поддерживать социальное дистанцирование. По мере того как экономики во всем мире постепенно восстанавливаются, мы все несем ответственность за продолжение борьбы с COVID-19. Концепция социального дистанцирования - это одна из стратегий обеспечения безопасности на месте, когда мы возвращаемся к работе. Создание системы сигнализации социального дистанцирования С..

Как применить дистанционное метрическое обучение к проблеме "улица-магазин"
Давайте начнем с определения проблемы, связанной с переходом из улицы в магазин: идентифицировать модный предмет на изображении пользователя и найти его в интернет-магазине. Вы когда-нибудь видели кого-нибудь на улице и думали: «Ого, это красивое платье, интересно, где его купить?» Нет. Но для меня это было крутой задачей попробовать методы дистанционного обучения метрике. Надеюсь, вам это тоже будет интересно. Набор данных Во-первых, нам нужен набор данных. Собственно, к этой..

Google Research SOTA GNN "Причины" взаимодействия с течением времени для улучшения понимания видео
За последние несколько лет исследования компьютерного зрения (CV), основанные на глубоком обучении, достигли впечатляющих успехов в классификации видеоклипов, взятых из Интернета, и анализе действий человека в них. Такие задачи на основе видео являются сложными, поскольку они требуют понимания взаимодействий между людьми, объектами и другим контентом и контекстом в данной сцене, а также рассуждений в течение длительных временных интервалов. Успешная модель CV в этой области должна..

Готовы ли вы к Vision Transformer (ViT)?
«Изображение стоит слов 16x16: трансформеры для распознавания изображений в масштабе» может стать еще одним прорывом в компьютерном зрении Жизни на Земле сталкиваются с циклом взлетов и падений. Это применимо не только к существам, но и к технологиям. Технологии в науке о данных полны шумихи и предвзятых историй успеха. При этом существуют технологии, которые привели к развитию науки о данных: сверточная нейронная сеть (CNN) . Начиная с AlexNet в 2012 году, различные архитектуры..

Использование PyTorch для знаменитого испытания Kaggle "Собаки против кошек", часть 2 (определение и отправка)
Эта история - вторая часть серии, где я объясняю, как выполнить задание Собаки против кошек на kaggle с помощью PyTorch. Если вы не читали первую часть серии, рекомендую сначала прочитать ее. В нем рассказывается о предварительной обработке данных, обучении модели из предварительно обученной модели, сохранении / загрузке лучшей модели и т. Д. Во второй части я расскажу о том, как делать выводы на основе тестовых данных, записывая их в файл csv и отправляя в kaggle. Код, показанный..

Какой алгоритм машинного обучения следует использовать в зависимости от типа проблемы?
Когда я только начинал заниматься наукой о данных, я часто сталкивался с проблемой выбора наиболее подходящего алгоритма для моей конкретной проблемы. Если вы похожи на меня, открывая статью об алгоритмах машинного обучения, вы видите десятки подробных описаний. парадокс в том, что они не облегчают выбор . Что ж, чтобы вы не сбились с пути, я бы посоветовал вам хорошо разбираться в реализации и математической интуиции, лежащей в основе нескольких контролируемых и..

Демонстрация использования преобразователей изображения в PyTorch: распознавание рукописных цифр MNIST
В этой статье я приведу практический пример (с кодом) того, как можно использовать популярный фреймворк PyTorch для применения Vision Transformer, который был предложен в статье « Изображение стоит 16x16 слов: преобразователи для распознавания изображений в масштабе » (который я рассмотрел в другом посте ), к практической задаче компьютерного зрения. Для этого рассмотрим проблему распознавания рукописных цифр с помощью известного MNIST dataset . Я хотел бы сразу сделать..