Публикации по теме computer-vision

Публикации по теме 'computer-vision'

Как я создал задачу компьютерного зрения на основе конечной точки REST с помощью Flask

Как я создал задачу компьютерного зрения на основе конечной точки REST с помощью Flask Это продолжение моего процесса знакомства с компьютерным зрением и методами машинного обучения. Как веб-разработчик (читается как разработчик рельсов ) я нашел эту растущую сферу захватывающей, но не работаю с этими технологиями изо дня в день. Это третий месяц из двухлетнего путешествия по изучению этой области. Если вы еще не читали, вы можете увидеть Часть 1 здесь: От веб-разработки до..

BIGO и ClothFormer iQIYI: реалистичная виртуальная примерка видео стала реальностью

Общие глобальные розничные продажи в сфере электронной коммерции выросли более чем в три раза за последние шесть лет и, по прогнозам, к 2025 году превысят 7 триллионов долларов США . Поскольку мода претендует на все большую долю этого рынка, поставщики все чаще внедряют виртуальную примерку на базе искусственного интеллекта. системы. Такие системы не только меняют покупательские привычки покупателей и стимулируют индустрию электронной коммерции, но и…

Раскрытие того, что нейронные сети «видят» с помощью FlashTorch

Набор инструментов визуализации функций с открытым исходным кодом для нейронных сетей в PyTorch Настройка сцены Пару недель назад я выступал с докладом на Hopperx1 London , организованном AnitaB.org в рамках London Tech Week. Колода слайдов доступна здесь . Я получил такой положительный отзыв после выступления, что решил написать немного более длинную версию доклада, чтобы раньше познакомить FlashTorch с миром :) Пакет доступен для установки через pip . Исходный код..

Классифицируйте персонажей Marvel, точно настроив преобразователь зрения

Тонкая настройка Vision Transformer (ViT) для классификации персонажей фильмов Marvel. Если вы просто хотите сначала опробовать модель, вы можете сделать это здесь . В области компьютерного зрения долгое время доминировали сверточные нейронные сети (CNN). С другой стороны, Трансформеры стали архитектурой глубокого обучения для любой задачи НЛП. Но в 2021 году, с появлением Vision Transformers paper , трансформеры тоже начали участвовать в гонке задач Computer Vision. В этой..

Демонстрация: битва классификаторов изображений

В хабе Hugging Face размещено более 1700 моделей классификации изображений. Я выбрал лучшие из Google, Meta, Microsoft, NVIDIA и Humphrey Shi. Все они были тщательно протестированы в наборе данных ImageNet-1k, что позволяет легко сравнивать их производительность с вашими изображениями. Наслаждаться! Пространство: https://huggingface.co/spaces/juliensimon/battle_of_image_classifiers

CNN — Основной

Я новичок в мире ИИ. Я изучал курсы по машинному обучению и очарован мощью глубокого обучения и особенно CNN. Прежде чем углубляться в материал CNN, давайте начнем с базовой искусственной нейронной сети (ANN). Вот общее модельное представление нейронной сети. Все идет нормально. Просто установите оптимизатор и функцию потерь в зависимости от вашей задачи. Затем получите входные данные в скрытые слои, пусть он выполнит работу по поиску взаимосвязей, чтобы предсказать цель. Не..

Раскрывая силу модели «сегментируй все что угодно»

Как видно из приведенной выше блок-схемы, подход, который использовали авторы, заключается в разделении модели на три подмодуля: (1) кодировщик изображений, (2) кодировщик подсказок (подсказка может быть точками/полями/текстами/частичными масками). (3) Декодер маски. (1) Кодировщик изображений: это может быть любой механизм извлечения признаков, который мы обычно используем в задачах компьютерного зрения. Здесь, в этой работе, автор использовал предварительно обученный MAE Vision..