Редкие наборы данных для компьютерного зрения, с которыми должен работать каждый специалист по машинному обучению

Вы когда-нибудь пытались угадать возраст другого человека? Что ж, может быть ДА !! Как насчет того, чтобы играть в такие игры, как поиск вещей за минимальное время? или о том, чтобы найти письменный знак там, где ваш врач написал в рецепте, когда вы заболели?

Что ж, каждый сталкивался с этими проблемами в реальной жизни. Как насчет того, чтобы попросить свою машину или любимый компьютер выполнить задание за вас. Разве это не здорово? на самом деле компьютеры используют машинное обучение. поэтому для этого нам действительно нужно обучить машину, используя несколько мощных наборов данных.

Ключ к совершенствованию в большинстве сфер жизни - это практика. Практикуйтесь в решении самых разных задач, от обработки изображений до распознавания речи. У каждой из этих проблем есть своя уникальная техника и подход. Но как получить эти данные?

Мы перечислили набор высококачественных наборов данных, над которыми должен работать каждый энтузиаст машинного обучения, чтобы применять и улучшать свои навыки. Работа с этими наборами данных сделает вас лучшим экспертом по данным и повысит объем знаний, которые вы получите будет бесценным в вашей карьере.

НАБОРЫ ИЗОБРАЖЕНИЙ

Обнаружение номерного знака автомобиля

Имеет около 500 изображений с номерными знаками автомобилей, отмеченными в виде прямоугольных ограничивающих рамок на изображениях автомобилей на дорогах и улицах.

Ссылка на набор данных.

Ключевые моменты лица знаменитости

База данных, содержащая около 2500 изображений с лицами знаменитостей и отмеченными важными ключевыми точками, такими как глаза, нос и т. Д.

Ссылка на набор данных.

Теги для одежды в электронной торговле

Изображения с сайтов электронной коммерции с ограничивающими рамками, нарисованными вокруг рубашек, курток, солнцезащитных очков и т. Д.

Имеет около 500 изображений, помеченных вручную для обнаружения предметов.

Ссылка на набор данных.

Набор данных о ранах

Около 300 изображений медицинской хирургии с ограничивающими рамками вокруг ран.

Ссылка на набор данных.

Набор данных IMDB-WIKI:

IMDb, сокращение от База данных Интернет-фильмов, представляет собой онлайн-базу данных информации, относящейся к мировым фильмам, телевизионным программам, домашним видео и видеоиграм, а также потокам в Интернете, включая биографии актеров, съемочной группы и персонала, краткое изложение сюжета, мелочи, обзоры и рейтинги фанатов. Дополнительная функция для поклонников - доски объявлений - была прекращена в феврале 2017 года. Первоначально это веб-сайт, управляемый фанатами, но база данных принадлежит и управляется IMDb.com, Inc., дочерней компанией Amazon. Не очень редкий, но дедушка всех наборов данных изображений.

Описание: IMDB и Википедия сталкиваются с изображениями с метками пола и возраста.
Экземпляры: 523051
Формат: изображения
Задача по умолчанию: классификация по полу, распознавание лиц, распознавание лиц, оценка возраста
Создано: 2015 г. Р. Роте, Р. Тимофте, Л. В. Гул.
Ссылка для скачивания: https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

"Комнаты:"

Этот набор данных представляет собой набор данных классификации изображений для классификации изображений комнат как спальни, кухни, ванной, гостиной, экстерьера и т. Д. Изображения из разных домов собираются и хранятся вместе в виде набора данных для компьютерного тестирования и обучения. Этот набор данных помогает определить, какое изображение какой части дома принадлежит.

Описание: набор данных содержит 20001 элемент, из которых 4404 элемента были помечены вручную.
Категории: спальня, кухня, ванная, экстерьер, гостиная, другое
Задача по умолчанию: классификация изображений, подписи к изображениям.
Формат: изображения
Создал: DataTurks
Ссылка для скачивания: https://dataturks.com/projects/sheerun/rooms

Набор данных Visual Genome:

Visual Genome - это набор данных, база знаний, постоянная попытка связать концепции структурированных изображений с языком.

Описание:

108,077 Изображения
5,4 миллиона описаний регионов
1,7 миллиона визуальных ответов на вопросы
3,8 миллиона экземпляров объектов

2,8 миллиона атрибутов
2,3 миллиона отношений
Все сопоставлено с наборами Wordnet Synsets

2) Формат: изображения, текст

3) Задача по умолчанию: подписи к изображениям.

4) Создано: 2016 г. Р. Кришна и др.

5) Ссылка для скачивания: http://visualgenome.org/api/v0/api_home.html

Набор данных классификации CRACK:

Этот набор данных предназначен для классификации трещин на стенах. Набор данных состоит из изображений стен с трещинами или без них.

У него есть изображения с тенью некоторых проводов, которые также выглядят как трещины на стене, мы должны тщательно обучить систему, чтобы она могла различать трещины и тень. Этот набор данных очень сложен, он обновит ваши навыки программирования.

Описание: набор данных содержит 1428 элементов, 1428 из которых были помечены вручную.
Категории: трещина, без трещины
Формат: изображения
Задача по умолчанию: классификация изображений
Создал: Data Turks
Ссылка для скачивания: https://dataturks.com/projects/miaozh17/Crack%20Classification

Набор данных IIT-5K OCR

Имеет 5K помеченных изображений уличных знаков, обрезанных, чтобы содержать только ту часть, где есть текст. Довольно сложный набор данных, ведь даже лучшие алгоритмы машинного зрения имеют точность 80%. (Читайте: сравнение Google, AWS, Microsoft OCR API в этом наборе данных)

Ссылка на набор данных.

Набор данных CARS:

Этот набор данных предназначен для идентификации автомобилей на изображениях. В наборе есть разные изображения, в которых есть или нет автомобили. Основная цель этого набора данных - идентифицировать даже небольшие детали автомобиля на изображениях. Этот набор данных помечен людьми.

Описание: набор данных содержит 613 элементов, из которых 604 элемента были помечены вручную.
Области деятельности: автомобили, без автомобилей.
Формат: изображения
Задача по умолчанию: классификация изображений.
Создал: Data Turks.
Ссылка для скачивания: https://dataturks.com/projects/dominique.paul.info/cars2

Набор данных FERET:

Программа распознавания лиц (FERET) находится под управлением Агентства перспективных оборонных исследовательских проектов (DARPA) и Национального института стандартов и технологий (NIST).

Департамент обороны США (DoD) Программный отдел разработки технологий по борьбе с наркотиками спонсировал программу по распознаванию лиц (FERET). Целью программы FERET было разработать возможности автоматического распознавания лиц, которые можно было бы использовать для помощи сотрудникам служб безопасности, разведки и правоохранительных органов в выполнении ими своих обязанностей. База данных FERET была собрана за 15 сеансов в период с августа 1993 г. по июль 1996 г. База данных содержит 1564 набора изображений, в общей сложности 14 126 изображений, которые включают 1199 лиц и 365 повторяющихся наборов изображений. Набор дубликатов - это второй набор изображений человека, уже внесенных в базу данных и обычно снятых в другой день.

Описание: 11338 изображений 1199 особей в разных положениях и в разное время.
Формат: изображения
Задача по умолчанию: классификация, распознавание лиц
Создано: 2003 г. в Министерстве обороны США.
Ссылка для скачивания: https: // www.nist.gov /.../ face-распознавание-технология-feret

Распознавание лиц

Имеет около 1300 лиц, отмеченных на изображениях как прямоугольные ограничивающие рамки. Изображения варьируются от частичных картинок до случайных людей на улицах.

Ссылка на набор данных.

Набор данных CALTECH-101:

Caltech 101 - это набор данных цифровых изображений. Набор данных Caltech 101 использовался для обучения и тестирования нескольких алгоритмов машинного обучения, распознавания компьютерного зрения и классификации. К каждому изображению предоставляется набор аннотаций. Каждый набор аннотаций содержит две части информации: общий ограничивающий прямоугольник, в котором расположен объект, и подробный заданный человеком контур, охватывающий объект. С аннотациями предоставляется сценарий MATLAB. Он загружает изображение и соответствующий ему файл аннотации и отображает их как фигуру MATLAB.

Набор данных Caltech 101 направлен на облегчение многих из этих общих проблем.

Изображения будут обрезаны и изменен размер.
Представлено множество категорий, что подходит как для алгоритмов распознавания одного, так и нескольких классов.
Обозначены подробные очертания объекта.
Доступный для общего использования, Caltech 101 действует как общий стандарт для сравнения различных алгоритмов без предвзятости из-за разных наборов данных.

Описание: Фотографии объектов, отмечены подробные контуры объектов.
Экземпляры: 9 146 изображений, разделенных на 101 категорию объектов, а также дополнительная категория фона / беспорядка.
Формат: изображения
Задача по умолчанию: Классификация, распознавание объектов.
Создано: сентябрь 2003 г., составитель Fei-Fei Li
Ссылка для скачивания: http://www.vision.caltech.edu/Image_Datasets/Caltech101/

Набор данных UXBOT:

Этот набор данных предназначен для классификации изображений uxbot на темные, профессиональные, минималистичные, гламурные и т. Д.… Uxbot - это платформа для общения в чате. Этот набор данных используется для обучения компьютера новым техническим навыкам. Это набор данных, помеченный людьми.

Описание: набор данных содержит 129 элементов, из которых 129 элементов были помечены вручную.
Формат: изображения
Категории: Элегантный, чистый, свежий, легкий, Воздушный, совместный, фанковый, Ретро, Эдди, веселье и т. Д.….
Задача по умолчанию: классификация изображений
Создано: Data Turks.
Ссылка для скачивания: https://dataturks.com/projects/briannaorg/UXBot

Набор данных LABELME:

LabelMe - это проект, созданный Лабораторией компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL), который предоставляет набор данных цифровых изображений с аннотациями. Набор данных является динамичным, бесплатным для использования и открытым для публики. Мотивация создания LabelMe исходит из истории общедоступных данных для исследователей компьютерного зрения. Большинство доступных данных были адаптированы к проблемам конкретной исследовательской группы и заставляли новых исследователей собирать дополнительные данные для решения своих собственных проблем. LabelMe был создан для устранения нескольких распространенных недостатков доступных данных.

Описание: Большой набор изображений для классификации объектов.
Формат: изображения, текст.
Задача по умолчанию: Классификация изображений, обнаружение объектов.
Создано: Лаборатория компьютерных наук и искусственного интеллекта Массачусетского технологического института к 2005 г.
Ссылка для скачивания: http://labelme.csail.mit.edu/Release3.0/browserTools/php/dataset.php

Редкие наборы данных для компьютерного зрения, с которыми должен работать каждый специалист по машинному обучению

НАБОРЫ ИЗОБРАЖЕНИЙ

Ключевые моменты лица знаменитости

Набор данных о ранах

Набор данных IMDB-WIKI:

"Комнаты:"

Набор данных Visual Genome:

Набор данных классификации CRACK:

Набор данных IIT-5K OCR

Набор данных CARS:

Распознавание лиц

Набор данных CALTECH-101:

Набор данных UXBOT:

Набор данных LABELME:

Здесь вы можете найти тысячи таких открытых наборов данных.

Вопросы по теме