Публикации по теме 'computer-vision'


Изучение API Google Cloud Vision и демонстрация функций с помощью Python
Дайте жизнь безграничным возможностям применения… Google Cloud Vision API - очень мощный инструмент, который может дать жизнь безграничным возможностям приложений в сочетании с библиотеками Python. Vision API - это предварительно обученная модель Google, которая обнаруживает объекты и лица, выполняет распознавание изображений, классификацию, маркировку и извлечение печатного или рукописного текста из изображений. Это позволяет разработчикам легко интегрировать встроенные функции...

Объяснимый ИИ: карты значимости
Серия блогов, в каждом из которых представлены практические инструменты для объяснения моделей машинного обучения. В этой статье мы рассматриваем карту значимости как инструмент для объяснения моделей компьютерного зрения. Формально карты значимости определяются как средство измерения пространственной поддержки определенного класса изображения в моделях компьютерного зрения. В интересах простоты мы можем переопределить карту важности как изображение, которое выделяет интересующую..

Лучшие выложенные планы и 3D-сканы | Сок
Zumo Labs представляет The Juice, еженедельный информационный бюллетень, посвященный проблемам компьютерного зрения (а иногда и просто обычным проблемам). Бери пока свежая . Неделя 26–30 апреля 2021 г. ____ Создание синтетических наборов данных из моделей САПР или других существующих 3D-файлов очень просто. Но что, если вы начинаете с нуля, не имея доступа к таким файлам? Несмотря на то, что существуют онлайн-хранилища существующих 3D-моделей, например Turbosquid, эти расходы могут..

Приложение для классификации изображений для глубокого обучения — часть 2 (построение модели)
Прежде чем читать эту статью, вы также должны прочитать мою первую статью здесь , потому что в моей первой статье я дал вам обзор моего проекта и мотивацию для этого проекта. Если вы уже прочитали часть 1, пришло время начать . В этой статье, часть 2, я сосредоточусь на шагах и процессах построения модели классификации изображений. Обычно для создания модели машинного обучения я выполняю следующие шаги: Сбор данных (либо из любого источника, либо мы собираем самостоятельно)..

Global Context Vision Transformers  — новая модель изображения SOTA от Nvidia
Подробное объяснение и визуализации Введение Nvidia недавно опубликовала новый преобразователь зрения под названием Global Context Vision Transformer ( GC ViT ) ( Hatamizadeh et al., 2022 ). GC ViT представила новую архитектуру, которая использует как глобальное , так и локальное внимание, что позволяет моделировать как ближние, так и дальние пространственные взаимодействия. Умные методы, используемые исследователями Nvidia, позволили GC ViT моделировать глобальное внимание,..

Итоги вебинара: что нового в FiftyOne 0.20 для компьютерного зрения
Недавно мы выпустили FiftyOne 0.20 , который содержит множество новых интересных функций, которые помогут вам организовывать, визуализировать, искать и исследовать наборы данных компьютерного зрения. Соучредитель Voxel51 и технический директор Брайан Мур рассказал нам о новых функциях на живом веб-семинаре с большим количеством живых демонстраций и примеров кода, чтобы вы могли увидеть все потрясающие возможности в действии. Вы можете посмотреть воспроизведение видео на YouTube ,..

Калибровка камеры
Геометрия камеры и модель обскуры Калибровка камеры или обратная засечка камеры оценивают параметры модели камеры-обскуры по данной фотографии. Обычно параметры камеры-обскуры представлены в матрице 3 × 4, называемой матрицей камеры. Мы используем эти параметры, чтобы оценить фактический размер объекта или определить местоположение камеры в мире . Как Прежде чем мы поговорим о калибровке камеры, сначала вам нужно понять, как работает камера-обскура. Почему мне нужно знать о..