Публикации по теме image-recognition

Публикации по теме 'image-recognition'

Руководство по созданию более быстрого RCNN в PyTorch

Понимание и внедрение Faster RCNN с нуля. Вступление Faster R-CNN - один из первых фреймворков, который полностью работает с глубоким обучением. Он основан на знании Fast RCNN , который действительно основан на идеях RCNN и SPP-Net . Хотя мы привносим некоторые идеи Fast RCNN при создании инфраструктуры Faster RCNN , мы не будем подробно обсуждать эти структуры. Одна из причин этого заключается в том, что Faster R-CNN работает очень хорошо и не использует традиционные методы..

«SeeFood»: создание двоичного классификатора с использованием трансферного обучения

«SeeFood»: создание двоичного классификатора с использованием трансферного обучения Силиконовая долина - одно из моих любимых шоу. У него безупречный комедийный тайминг, великолепный актерский состав и идеальная карикатура на все, что связано с технологиями. Одна из моих любимых сцен из сериала - это когда один из начинающих предпринимателей, Цзянь Ян, разрабатывает, казалось бы, бесполезное приложение, которое классифицирует еду как «хот-дог» или «не хот-дог». Я не буду отдавать..

Розничная торговля в магазине — Сейчас и в будущем!

Розничная реализация в магазине — сейчас и в будущем! Устаревший процесс сбора данных в магазине с помощью ручного аудита приводит к тому, что компании, занимающиеся потребительскими товарами, получают неточные и противоречивые данные. Решения по распознаванию изображений и искусственному интеллекту меняют представление о том, как осуществляется розничная торговля. Распознавание изображений и искусственный интеллект станут важной частью сбора точных данных о розничной торговле в..

Подготовка данных

В настоящее время наборы данных изображений содержат огромное количество образцов. Подобное неверно для наборов данных 3D-моделей. Они не содержат сотни тысяч изображений. Они недостаточно изучены и сбалансированы. Также большинство наборов данных содержат тела, не выровненные по ориентации. Примером относительно четкого набора данных 3D-тела является ModelNet10 . Тело из набора данных сохраняется в виде файла .off , содержащего вершины, ребра и грани. Материалы, текстуры и прочее..

Приложение CNN для распознавания лиц / изображений

Приложение CNN для распознавания лиц / изображений Аннотация В настоящее время метод распознавания лиц становится все более важным методом в нашей социальной жизни. От технологии обнаружения лиц, реализованной в наших дешевых камерах, до сложной глобальной системы наблюдения Skynet, разработанной интеллектуальными агентствами, такие методы широко используются во многих областях, и рынок по-прежнему быстро растет. Обнаружение лиц было активной областью исследований со многими..

Давайте распознавать изображения с VGG16

VGG16 — это модель CNN (сверточная нейронная сеть), которая уже изучена. Мы можем распознавать и классифицировать изображения с помощью VGG16 в Python. Что такое VGG16? VGG16 — это модель CNN, которая изучается с помощью крупномасштабного набора данных, называемого ImageNet. VGG16 имеет 16 слоев. Эта технология была представлена в 2014 году, как одна из известных моделей распознавания образов. VGG16 имеет 1000 выходных слоев, поэтому входное изображение можно классифицировать по..

Сверточная нейронная сеть - чтение на ходу

В связи с появлением в последнее время множества интересных проектов по компьютерному зрению существует неотъемлемая потребность понять, как работают модели в рамках этих проектов. Чтобы коснуться этих проектов, я расскажу о сверточных нейронных сетях или CNN, которые представляют собой многоуровневую нейронную сеть со специальной архитектурой для обнаружения сложных функций в данных. Сети CNN использовались в распознавании изображений, проектах дополненной реальности и, конечно же, в вашем..