Публикации по теме computer-vision

Публикации по теме 'computer-vision'

Создание одноразовой обучающей сети с помощью PyTorch

Как построить глубокую сеть с таким небольшим количеством образцов для каждого класса? В последние годы глубокое обучение стало довольно популярным для задач распознавания и классификации изображений из-за его высокой производительности. Однако традиционные подходы к глубокому обучению обычно требуют большого набора данных для обучения модели, чтобы различать очень мало разных классов, что кардинально отличается от того, как люди могут учиться даже на очень немногих примерах...

Комплексное исследование глубокого обучения в ключевых приложениях компьютерного зрения

«Признание: некоторые разделы предоставленного контента являются неотъемлемыми компонентами задания курса «ID5030 Машинное обучение для инженерных приложений» в ИИТ Мадраса. Эти разделы изначально были написаны мной в качестве ассистента преподавателя курса». В последние годы сфера компьютерного зрения (CV) претерпела трансформационные изменения с появлением глубокого обучения и сверточных нейронных сетей (CNN). Современные библиотеки глубокого обучения, такие как PyTorch, TensorFlow и..

Команда Kaiming He из MetaAI предлагает ViTDet: магистральную сеть Plain Vision Transformer, конкурирующую с…

Обнаружение объектов — это фундаментальная задача компьютерного зрения, обычно выполняемая детекторами, состоящими из независимой от задачи основы и независимо разработанных шеек и головок, которые включают предварительные знания, специфичные для обнаружения. Из-за де-факто конструкции…

Компьютерное зрение: как решить проблему дисбаланса классов в наборах данных изображений?

Вот 4 вещи, которые вы могли бы сделать, если бы у вас было 200 изображений собак и только 35 изображений кошек. Если вы следили за моими предыдущими статьями, я показал, почему наборы данных реального мира всегда ошибочны и несовершенны, и сколько проблем возникнет, как только вы доберетесь до…

Технологии, дающие мобильным роботам творческие возможности

Технологии, которые наделяют мобильных роботов творческой силой Создавайте то, чего вы не видите — синтез изображений для мобильных роботов-манипуляторов Это краткое изложение исследования – лишь одно из многих, которые еженедельно публикуются в информационном бюллетене для ученых, занимающихся искусственным интеллектом. Чтобы начать получать еженедельную рассылку , зарегистрируйтесь здесь . В то время как люди могут полагаться на прошлый опыт для достижения завершения формы..

Размещение продуктов в розничных магазинах - 1

Часть 1 Сколько раз бывает, что вы заходите в магазин, наполняете тележку всевозможными вещами, просто чтобы понять, что это у вас есть дома / не хотите тратить ТАК много на просто конфеты / просто не хочется это больше. Кроме того, вы не чувствуете, что отправляетесь в поисках законного места для предмета в магазине, который довольно часто превышает ваше среднее расстояние, пройденное за день (упс?). Итак, вы бросаете его туда, где он есть. Я не хочу быть виноватым, но владельцы..

Train Pointer Net для сегментации объектов, деталей и материалов в 60 строках кода

Сеть указателей — это вариация сетей семантической сегментации , которая может сегментировать изображение практически на все: объекты (люди/автомобили...), вещи (небо, земля), части (ноги/колеса) и материальные фазы ( жидкости/твердые вещества). В отличие от семантической сети, она может сегментировать экземпляры с неизвестными классами и, в отличие от Mask RCNN , не ограничена ограничивающей рамкой. Сеть указателей получает изображение, точку (пиксель) на изображении и предсказывает..