Публикации по теме 'computer-vision'


Генерация якорных блоков с использованием кластеризации K-средних
Эта статья направлена ​​на реализацию алгоритма K-средних для генерации блоков привязки для архитектур обнаружения объектов, что является важной концепцией для обнаружения небольших или необычных объектов на изображении. Что такое поле привязки? Якорные рамки  – это набор предопределенных ограничивающих рамок определенной высоты и ширины. Эти поля определены для захвата масштаба и соотношения сторон определенных классов объектов, которые вы хотите обнаружить, и обычно..

Индийский институт населенных пунктов - Путешествие по стажировке.
К концу моего 5-го семестра по специальности Компьютерная инженерия в NIT Surat все мои товарищи либо искали стажировку, либо получили ее в кампусе. Я был одним из тех, кто нашел хорошую стажировку, особенно исследовательскую. Раньше я проходил несколько стажировок в стартапах, а также у меня был собственный стартап, поэтому на этот раз я хотел пройти исследовательскую стажировку, которая идеально подошла бы для моих будущих начинаний. Первой ошибкой, которую я сделал, было то, что я..

Проверка работоспособности данных компьютерного зрения с помощью CleanVision — 1
Проверка работоспособности данных — важный шаг в компьютерном зрении, который часто упускается из виду. Этот процесс включает проверку правильности, полноты и согласованности данных, используемых для обучения и тестирования моделей машинного обучения. Другими словами, это гарантирует точность и надежность данных. Без надлежащей проверки достоверности данных результаты моделей машинного обучения могут быть непредсказуемыми или даже вводящими в заблуждение. CleanVision — это..

Обнаружение кораблей и самолетов на спутниковых снимках | Авентиор
Корабли и самолеты перевозят большую часть предметов по всему миру. Ежегодно по всему миру перевозится более 11 миллиардов тонн грузов. К ним относятся транспортные средства, химические газы и жидкости, твердые материалы в контейнерах и т. д. Когда эти виды транспорта перевозят так много материалов, становится крайне важно контролировать и отслеживать их перемещение по всему миру. Анализ спутниковых изображений предлагает отличное решение таких проблем. Этот анализ изображений не..

Image Tagger - Multi-Label CNN Image Classification
Генерация умных хэштегов В сегодняшней статье мы собираемся выполнить классификацию изображений с несколькими метками с помощью сверточных нейронных сетей. Модель машинного обучения, обученная с использованием такого подхода, сможет генерировать несколько описательных меток для заданного входного изображения. Такое приложение можно использовать для создания хэштегов для сообщений в социальных сетях, как в приведенном ниже примере ( Приложение для iOS )...

Используйте параллелизм в Python и верните свое время
Если вы программируете на Python и не используете параллелизм там, где это возможно, скорее всего, вы не сделаете столько, сколько могли бы. Используя параллелизм, мы можем сократить время, необходимое для получения ответов, давая нам больше времени, чтобы выйти на улицу, выгулять собаку и понюхать цветы. Верный своей форме, Python предоставляет простой и интуитивно понятный интерфейс для настройки параллельных рабочих процессов. Однако включать их в нашу работу может быть пугающе,..

Объяснения документов 13: Макет LM v3
LayoutLMv3 применяет унифицированный мультимодальный преобразователь текста и изображения для изучения кросс-модальных представлений. Transformer имеет многоуровневую архитектуру, и каждый уровень в основном состоит из многоуровневых сетей самоконтроля и полностью связанных сетей прямой связи по положению. Входные данные Transformer представляют собой конкатенацию последовательностей встраивания текста Y = y1:𝐿 и встраивания изображения X = x1:𝑀, где 𝐿 и 𝑀 — длины последовательностей..