Публикации по теме 'computer-vision'


Краткая история обнаружения краев
Я думаю, все мы согласны с тем, что изображения прекрасны. Их приятно щелкать, манипулировать ими и извлекать из них функции. Вся моя карьера дизайнера и инженера по обработке изображений связана с тем, что мне нравилось дурачиться с изображениями в MS Paint. Кстати об особенностях Если вы читаете этот блог, должен быть один из двух различных сценариев, которые привели вас сюда. Я держал тебя под прицелом и заставил прочитать это. Вы заинтересованы в обработке изображений, даже если..

Основы HyperLabel: классификация изображений с помощью Create ML
Серия руководств по аннотации данных машинного обучения Логана Спирса, руководителя по инновациям Sixgill, LLC Вступление Классификация изображений, привет мир компьютерного зрения, присваивает изображениям классификации (или категории). Например, когда мы создаем модель машинного обучения (ML), которая вводит изображение акулы и выводит ее вид, это классификация изображений. HyperLabel включает рабочие процессы классификации изображений с помощью метки Выбрать . Поскольку..

Классификатор Food-101 с использованием ResNet50 на Colab — Онур Андрос Озбек
Получение точности SOTA на уровне 88% в наборе данных Food-101 с использованием модели ResNet50 с FastAI в Google Colab. Давайте прямо в это. Приведенные ниже команды оболочки устанавливают необходимые пакеты. Мне пришлось понизить версию PyTorch и Torchvision из-за проблем совместимости с Colab. %reload_ext autoreload %autoreload 2 !apt-get update !apt install wget !pip install pathlib !pip install fastai !pip install "torch==1.4" "torchvision==0.5.0" Ниже..

Развертывание распознавания лиц OpenCV в веб-фреймворке Flask
Введение Если вы хотите изучить основы OpenCV, пройдите этот блог . В этом блоге мы собираемся рассказать о распознавании лиц с помощью Flask API Deployment. Краткое введение в OpenCV — это библиотека Python, предназначенная для решения проблем компьютерного зрения. Он используется в различных приложениях, таких как обнаружение лиц, захват видео, отслеживание движущихся объектов и раскрытие объектов. Флэш-API Flask — широко используемый микровеб-фреймворк для создания API на..

Решения для обеспечения безопасности жилых помещений с YOLO-v5
В связи с растущими проблемами безопасности в обществе неизвестные транспортные средства могут представлять потенциальную опасность, и для решения этой проблемы я попытался создать решение для обеспечения безопасности, которое обнаруживает номерные знаки транспортных средств и регистрирует их в базе данных вместе с отметкой времени, на которой они были обнаружены. камера. Мотивация проекта Неизвестные транспортные средства в жилых домах могут причинять неудобства жильцам, даже несмотря..

Трансферное обучение и сверточные нейронные сети (CNN)
Полное руководство от CNN по переносу обучения для набора данных Kaggle «Кошка против собаки» В современную эпоху нейронные сети побеждают традиционные алгоритмы машинного обучения при моделировании сложных наборов данных, особенно неструктурированных данных — пространственных данных (компьютерное зрение) или последовательных данных (NLP и временные ряды).

Модель искусственного интеллекта студента из Принстона создает китайские пейзажи, которые вводят в заблуждение специалистов по оценке
В последние годы искусственный интеллект становится все более способным создавать впечатляющие произведения искусства в самых разных стилях, в основном благодаря появлению и совершенствованию генеративных состязательных сетей (GAN). Студентка из Принстона Элис Сюэ разработала структуру GAN для поколения китайской пейзажной живописи, которая настолько эффективна, что большинство людей не может отличить ее работы от настоящих. Предлагаемая структура, Sketch-And-Paint GAN (SAPGAN),..