Публикации по теме 'computer-vision'


Нейронные сети квантовой свертки
Сверточные нейронные сети — это разновидность архитектуры обучения представлению на основе нейронной сети, которая использовала операцию свертки для понижения дискретизации большой N-мерной карты объектов, сохраняя при этом важную информацию нетронутой в низкоразмерных представлениях. Я не буду вдаваться в подробности того, что такое CNN, как они работают. Что такое операция свертки, максимальный пул, средний пул или глобальный пул? Я ожидаю, что читатель этой статьи хорошо разбирается в..

BiSeNet для сегментации в реальном времени, часть I
В этом посте я расскажу вам о сети двусторонней сегментации для семантической сегментации в реальном времени. Последние две недели я читал и извлекал знания из этой интересной исследовательской статьи, которую я нашел на arXiv.org , которая направлена ​​на повышение точности, скорости вывода и многих других проблем, с которыми сталкивается наша современная модель. в области семантической сегментации . Что такое семантическая сегментация и почему вам это нужно? Семантическая..

Как обмануть нейронную сеть?
С некоторыми враждебными входами нейронные сети можно легко обмануть. Представьте, что вы находитесь в 2050 году и едете на работу в беспилотном автомобиле (возможно). Внезапно вы понимаете, что ваша машина едет со скоростью 100 км / ч по оживленной дороге после проезда поперечной полосы, и не понимаете почему. ЧИСТЫЙ УЖАС! Что могло случиться? Что ж, причин может быть много. Но в этой статье мы сосредоточимся на одной конкретной причине - машину обманули . Чтобы быть..

8 ключевых уроков из работы над секретными продуктами компьютерного зрения для коммерции
В прошлом месяце Google публично выпустил стелс-проект под названием Shoppable Images. С помощью этого продукта веб-сайты могут предоставлять Google разрешение сканировать изображения на своих сайтах с помощью Javascript, предоставлять визуально похожие продукты и позволять пользователям покупать продукты всего за 3 клика. Это игра с распределенной коммерцией, а это означает, что технология должна позволять людям покупать что угодно, когда и где угодно. Расширенная обработка..

Начало работы в области искусственного интеллекта и компьютерного зрения с Nvidia Jetson Nano.
Плата Nividia Jetson Nano позволяет разрабатывать собственные проекты IA во встроенной системе. От распознавания лиц до автономного вождения. С развитием ИИ и Интернета вещей Nvidia предлагает нам простое, дешевое и мощное решение для разработки встроенных приложений искусственного интеллекта. Джетсон Нано открывает возможности для создания самодельных роботов, интеллектуальных систем… Jetson Nano - это плата, похожая на малину, но гораздо более мощная, которая запускает..

Mutan: Multimodal Tucker Fusion для визуальных ответов на вопросы
Предисловие: автором является Хеди Бен Юнес, бывший аспирант LIP6 / Heuritech. Мультимодальное слияние текстовой и графической информации является важной темой в Heuritech, поскольку большая часть медиа в Интернете состоит из изображений, видео и текста. Сложная визуальная задача «Ответы на вопросы» — отличный ориентир для слияния текста и изображения. В этом сообщении в блоге представлены работы, выполненные Эди Бен-Юнесом *, Реми Каденом *, Матье Кордом и Николя Томом . Доклад..

Создайте набор данных компьютерного зрения за 30 минут
Самый утомительный и часто самый эффективный шаг в построении любой модели машинного обучения - это создание набора данных для обучения, проверки и тестирования вашей модели. В этом руководстве вы изучите самый простой способ собрать и аннотировать набор данных компьютерного зрения в два этапа: Массовое извлечение изображений из Bing с помощью простой библиотеки Python Аннотируйте и экспортируйте свой набор данных с помощью инструмента Roboflow в браузере. 1) Загрузить..