Эта статья представляет собой отличный пример применения техники Mixture-of-Experts к реальной проблеме компьютерного зрения. Он ориентирован на повторную идентификацию человека, которая в данном случае определяется как «идентификация людей по изображениям, снятым несколькими камерами, без перекрытия обзора». Авторы утверждают, что для успешной переидентификации человека необходим весь спектр смысловых уровней входного образа. Отходя от использования только одного или нескольких предварительно обученных уровней VGG, они применяют теорию смеси экспертов, чтобы позволить сети бесконтрольно изучать семантические функции (факторные модули FM) и силу их влияния (модули выбора факторов FSM ) на всех уровнях, которые затем объединяются, чтобы создать окончательное представление внешнего вида человека.

Абстрактный:

«Ключом к эффективной повторной идентификации человека (Re-ID) является моделирование дискриминационных и инвариантных к взглядам факторов внешнего вида человека как на высоком, так и на низком семантическом уровнях. Недавно разработанные модели глубокой повторной идентификации либо изучают целостное представление признаков на одном семантическом уровне, либо требуют трудоемких человеческих комментариев к этим факторам как атрибутам. Мы предлагаем многоуровневую сеть факторизации (MLFN), новую сетевую архитектуру, которая разделяет внешний вид человека на скрытые дискриминативные факторы на нескольких семантических уровнях без ручного аннотирования. MLFN состоит из нескольких составных блоков. Каждый блок содержит несколько модулей факторов для моделирования скрытых факторов на определенном уровне и модули выбора факторов, которые динамически выбирают модули факторов для интерпретации содержимого каждого входного изображения. Выходы модулей выбора факторов также предоставляют компактный дескриптор скрытого фактора, который дополняет традиционные глубоко изученные функции. MLFN достигает самых современных результатов по трем наборам данных Re-ID, а также убедительных результатов по набору данных CIFAR-100 для общей категоризации объектов ».

Для получения более подробной информации и хорошего прочтения ознакомьтесь с бумагой: https://arxiv.org/abs/1803.09132

Мы нанимаем!

Brighter AI разработал инновационное решение для обеспечения конфиденциальности визуальных данных: Deep Natural Anonymization. Решение заменяет идентифицирующую личность информацию, такую ​​как лица и номерные знаки, на искусственные объекты, что позволяет использовать все варианты использования ИИ и аналитики, например беспилотные автомобили и умная розничная торговля. В 2018 году NVIDIA назвала немецкую компанию Самым популярным стартапом в области искусственного интеллекта в Европе.