Публикации по теме 'computer-vision'
Нейронные сети квантовой свертки
Сверточные нейронные сети — это разновидность архитектуры обучения представлению на основе нейронной сети, которая использовала операцию свертки для понижения дискретизации большой N-мерной карты объектов, сохраняя при этом важную информацию нетронутой в низкоразмерных представлениях. Я не буду вдаваться в подробности того, что такое CNN, как они работают. Что такое операция свертки, максимальный пул, средний пул или глобальный пул? Я ожидаю, что читатель этой статьи хорошо разбирается в..
BiSeNet для сегментации в реальном времени, часть I
В этом посте я расскажу вам о сети двусторонней сегментации для семантической сегментации в реальном времени.
Последние две недели я читал и извлекал знания из этой интересной исследовательской статьи, которую я нашел на arXiv.org , которая направлена на повышение точности, скорости вывода и многих других проблем, с которыми сталкивается наша современная модель. в области семантической сегментации .
Что такое семантическая сегментация и почему вам это нужно?
Семантическая..
Как обмануть нейронную сеть?
С некоторыми враждебными входами нейронные сети можно легко обмануть.
Представьте, что вы находитесь в 2050 году и едете на работу в беспилотном автомобиле (возможно). Внезапно вы понимаете, что ваша машина едет со скоростью 100 км / ч по оживленной дороге после проезда поперечной полосы, и не понимаете почему.
ЧИСТЫЙ УЖАС!
Что могло случиться?
Что ж, причин может быть много. Но в этой статье мы сосредоточимся на одной конкретной причине - машину обманули .
Чтобы быть..
8 ключевых уроков из работы над секретными продуктами компьютерного зрения для коммерции
В прошлом месяце Google публично выпустил стелс-проект под названием Shoppable Images. С помощью этого продукта веб-сайты могут предоставлять Google разрешение сканировать изображения на своих сайтах с помощью Javascript, предоставлять визуально похожие продукты и позволять пользователям покупать продукты всего за 3 клика. Это игра с распределенной коммерцией, а это означает, что технология должна позволять людям покупать что угодно, когда и где угодно. Расширенная обработка..
Начало работы в области искусственного интеллекта и компьютерного зрения с Nvidia Jetson Nano.
Плата Nividia Jetson Nano позволяет разрабатывать собственные проекты IA во встроенной системе. От распознавания лиц до автономного вождения.
С развитием ИИ и Интернета вещей Nvidia предлагает нам простое, дешевое и мощное решение для разработки встроенных приложений искусственного интеллекта. Джетсон Нано открывает возможности для создания самодельных роботов, интеллектуальных систем…
Jetson Nano - это плата, похожая на малину, но гораздо более мощная, которая запускает..
Mutan: Multimodal Tucker Fusion для визуальных ответов на вопросы
Предисловие: автором является Хеди Бен Юнес, бывший аспирант LIP6 / Heuritech. Мультимодальное слияние текстовой и графической информации является важной темой в Heuritech, поскольку большая часть медиа в Интернете состоит из изображений, видео и текста. Сложная визуальная задача «Ответы на вопросы» — отличный ориентир для слияния текста и изображения.
В этом сообщении в блоге представлены работы, выполненные Эди Бен-Юнесом *, Реми Каденом *, Матье Кордом и Николя Томом . Доклад..
Создайте набор данных компьютерного зрения за 30 минут
Самый утомительный и часто самый эффективный шаг в построении любой модели машинного обучения - это создание набора данных для обучения, проверки и тестирования вашей модели.
В этом руководстве вы изучите самый простой способ собрать и аннотировать набор данных компьютерного зрения в два этапа:
Массовое извлечение изображений из Bing с помощью простой библиотеки Python Аннотируйте и экспортируйте свой набор данных с помощью инструмента Roboflow в браузере.
1) Загрузить..