Публикации по теме computer-vision

Публикации по теме 'computer-vision'

Средство поиска улиц - обнаружение переулков для беспилотных автомобилей 🚗

Обнаружение полос с помощью компьютерного зрения В сегодняшней статье мы собираемся использовать базовые методы компьютерного зрения для решения проблемы обнаружения уличных полос, которая имеет решающее значение для беспилотных автомобилей. К концу этой статьи вы сможете выполнять обнаружение полос в реальном времени с помощью Python и OpenCV . Реализация Вы можете найти полную кодовую базу для этого проекта на GitHub , и я рекомендую вам проверить ее и следовать...

Классификация кошек и собак с помощью CNN

Учебник по классификации изображений Pytorch. На практике классификация кошек и собак может оказаться несколько ненужной. Но для меня это на самом деле хорошая отправная точка для изучения нейронных сетей. В этой статье я собираюсь поделиться своим подходом к выполнению задачи классификации. Доступ к используемому набору данных можно получить по этой ссылке . Вот план этой статьи: Импорт модулей и настройка устройства Загрузить изображения и создать ярлыки Предварительная..

Массачусетский технологический институт MCUNet привносит глубокое обучение в Интернет вещей (IoT), используя ЦП 0,5 долл. США.

Массачусетский технологический институт MCUNet привносит глубокое обучение в Интернет вещей (IoT) с помощью микросхем микроконтроллера стоимостью 8 долларов США с 0,5 МБ SRAM и 2 МБ FLASH (достигает ›70% на ImageNet). Алгоритмы искусственного интеллекта худеют, чтобы поместиться в вашем холодильнике https://lnkd.in/eKR387U Массачусетский технологический институт Новости — Система привносит глубокое обучение в устройства интернета вещей https://lnkd.in/eAb7W_a MCUNet:..

Представляем Complete the Look: систему дополнительных рекомендаций на основе сцен

Эрик Ким и Эйлин Ли | Визуальный поиск В команде визуального поиска Pinterest мы постоянно работаем над тем, чтобы помочь людям находить новые идеи визуально, даже если у них нет слов, чтобы описать то, что они ищут. В традиционной системе поиска изображений цель состоит в том, чтобы вернуть результаты, которые визуально похожи на изображение запроса, однако мы работаем с механизмом визуального обнаружения, где нам нужно идентифицировать и возвращать визуальные компоненты из более широкой..

[Модели Vision-Language — ViT] Обзоры статей: изображение стоит 16x16 слов: трансформеры для…

[Модели Vision-Language — ViT] Краткий обзор статьи: изображение стоит 16x16 слов: трансформеры для распознавания изображений в масштабе Документ: изображение стоит 16x16 слов: преобразователи для распознавания изображений в масштабе, https://arxiv.org/pdf/2010.11929v2.pdf =============================================================== Предыстория и введение По сравнению с доминированием моделей трансформаторов в НЛП, его применение в CV началось поздно, пока не появилась модель..

Что на arXiv: Еженедельный обзор № 3

Приветствую, Среднее сообщество, В этом выпуске представлены публикации, опубликованные на arXiv за период с 8 по 14 апреля, и представлены идеи и анализ наиболее значимых исследований и тенденций. Давайте погрузимся! Сегментируйте все везде и сразу Расширение Segment Anything Model (SAM) , которое позволяет использовать кросс-модальные подсказки: ограничивающие рамки, точки, каракули, текст, аудио или без подсказок. Встроенный инструмент позволяет не только сегментировать..

Обзор: ИИ и компьютерное зрение в обнаружении рака яичников (2023 г.)

Четыре года назад было проведено несколько относительно примитивных исследований по использованию ИИ для обнаружения рака. Тогда технологии не было нигде, как сейчас. В 2020 году моя мама умерла относительно внезапно. Уже после ее смерти мы узнали, что у нее злокачественная смешанная мюллерова опухоль (МММО). Этот вид рака может быть обнаружен в матке, яичниках, фаллопиевых трубах и шейке матки. Диагноз этого вида рака яичников чрезвычайно низок — большинству женщин НЕ..