С быстрым развитием глубокого обучения возможности распознавания зрения на основе искусственного интеллекта также значительно улучшились за последние несколько лет. При этом компьютерное зрение по-прежнему сталкивается с серьезными проблемами при детальной классификации и обучении по соответствующей категории. Чтобы стимулировать инновации в этой сфере, Google запустил глобальный конкурс iNaturalist 2018 Challenge, который представляет собой крупномасштабное соревнование по классификации видов, организованное iNaturalist и Visipedia.

То, что обычно называют «концептуальными деревьями», является важным инструментом для человеческого понимания мира. Каждый человек учится узнавать знакомые предметы с момента своего рождения. Однако просто идентифицировать большое количество дискретных объектов не очень полезно. Более существенная способность человеческого познания состоит в том, чтобы организовать распознанные объекты по категориям в древовидную структуру, в которой иерархические отношения естественным образом соответствуют близости между различными объектами. Это не только индукция существующих знаний, но и важная основа для вывода о нераспознанных объектах. Например, когда наши предки бродили по Африке и впервые увидели гепарда, мы все еще можем сделать вывод о нем как о большом и неизвестном хищнике, основываясь на нашем опыте общения с тиграми и львами. До сих пор не совсем ясно, как мы, люди, обосновываем лежащие в основе взаимосвязи и строим такое дерево понятий в своем мозгу, но сегодня многие исследователи познания считают, что наш мозг может использовать для этой цели теорему Байеса.

Фактически, многие эксперты по ИИ считают, что слияние быстрорастущей технологии глубокого обучения и байесовского мышления станет важной тенденцией как в понимании человеческого мозга, так и в разработке более мощных алгоритмов машинного обучения. Глубокие нейронные сети служат отличным инструментом для определения высококачественных функций, в то время как методы, основанные на байесовском методе, предоставляют мощный инструмент для вывода основных отношений между функциями и соответствующими объектами. Google специально назвал это технологией «Лучшее машинное обучение», которая в конечном итоге позволит машинам иметь сравнимый уровень способностей к рассуждению с человеческими существами. Профессор Дэн Янгдун также активно работал над интеграцией байесовских вычислений и глубокого обучения. Его команда сейчас создает специальную аппаратную платформу для интеграции как глубокого обучения, так и байесовских вычислений.

Основная цель Google при проведении этого конкурса - добиться высококачественной детальной классификации растений и животных. Профессор Дэн Янгдун также упомянул: «Основная работа биолога (который в то время был натуралистом) до Дарвина заключалась в открытии новых видов и включении их в систему таксономии, которая на самом деле представляет собой дерево понятий. Теперь мы хотим, чтобы машина была квалифицированным «натуралистом», который идентифицирует подвиды, выделяя локальные особенности, характерные для каждого вида. Фактически, такая классификация будет включать визуальное распознавание, но также требуется обнаружение, позиционирование и сегментация объектов. Вы можете представить себе, как научить машинный классификатор различать двухточечные, трехточечные, четырехточечные, пятиточечные, шеститочечные и семиточечные божьи коровки. Хотя соревнование iNaturalist не требует явного построения дерева понятий, оно заложит основу для разработки высокоэффективных решений по категориальному обучению.

Конкурс предлагает набор данных из 450 000 обучающих изображений. Изображения в наборе данных следуют распределению «длинный хвост», и многие категории будут иметь ограниченное количество выборок. Для машинного обучения важно обрабатывать длиннохвостые распределения, потому что мир природы может быть сильно несбалансированным, а некоторые из этих видов богаче и их легче фотографировать по сравнению с другими. Однако такое распределение также предполагает быстрое обучение для майских категорий.

Профессор Дэн Янгдун - главный специалист по искусственному интеллекту MATRIX и доцент Университета Цинхуа. Как технологический лидер команды MATRIX, он занимается исследованиями в области искусственного интеллекта, параллельных алгоритмов и компьютерной архитектуры. В настоящее время профессор Дэн отвечает за общий дизайн методов и оборудования искусственного интеллекта проекта MATRIX. Его команда заняла первое место в конкурсе COCO (общие объекты в контексте), международном конкурсе алгоритмов компьютерного зрения, организованном Microsoft и Facebook.

Конкурс iNaturalist 2018 Challenge будет закрыт в начале июня этого года. Осталось менее трех месяцев, и нам не терпится увидеть результат!

Для получения дополнительной информации о конкурсе iNaturalist 2018 Challenge перейдите по следующим ссылкам:

Matrix AI Network использует новейшие технологии искусственного интеллекта, чтобы реализовать обещание блокчейна.

СЛЕДУЙТЕ МАТРИЦЕ:
Веб-сайт
| Github | Twitter | Reddit | Facebook | Youtube | Discord
Telegram
(Официальный) | Telegram (Мастерноды)
Оуэн Тао (генеральный директор) | Стив Дэн (главный специалист по искусственному интеллекту)