Конференция IEEE по компьютерному зрению и распознаванию образов, 2018 г.

Ссылка на все документы

http://openaccess.thecvf.com/CVPR2018.py

Награды за лучшую бумагу

  1. Taskonomy: распутывание обучения переносу задач
  2. Total Capture: 3D-модель деформации для отслеживания лиц, рук и тел
  3. Глубокое изучение сопоставления графов
  4. SPLATNet: сети с разреженной решеткой для обработки облаков точек
  5. CodeSLAM — Изучение компактного, оптимизируемого представления для плотного визуального SLAM
  6. Эффективная оптимизация ранговых функций потерь

Обнаружение объекта

  1. Многомасштабное представление ядра с учетом местоположения для обнаружения объектов
  2. Скрытая мини-энтропийная модель для обнаружения слабо контролируемых объектов [code]
  3. Потеря Ловаса-Софтмакс: удобный суррогат для оптимизации «меры пересечения над объединением в нейронных сетях
  4. На пути к высокоэффективному обнаружению видеообъектов
  5. Пулинг с сохранением деталей в глубоких сетях [код]

Обработка GroundTruth

  1. Изучение интеллектуальных диалогов для аннотации ограничительной рамки

Камера 360° и 3D-видение

  1. LayoutNet: Реконструкция 3D-плана комнаты из одного изображения RGB (относится к structionsite и камерам 360°)
  2. GVCNN: сверточные нейронные сети группового просмотра для распознавания трехмерных форм
  3. Выделение формы, позы и макета из 2D-изображения 3D-сцены
  4. Тестовый тест действий рук от первого лица с видео RGB-D и 3D-аннотациями поз рук
  5. Учимся оценивать трехмерную позу и фигуру человека по одному цветному изображению
  6. PointFusion: Deep Sensor Fusion для оценки ограничивающей рамки 3D
  7. GVCNN: сверточные нейронные сети группового просмотра для распознавания трехмерных форм
  8. Выделение формы, позы и макета из 2D-изображения 3D-сцены
  9. Неконтролируемое обучение монокулярной оценке глубины и визуальной одометрии с реконструкцией глубоких черт

Заметность и внимание на основе

  1. Рекуррентная сеть с прогрессивным вниманием для обнаружения заметных объектов
  2. Переход от изображения к видео: повышение значимости изображения с помощью динамического привлечения внимания
  3. Скажи мне, где искать: сеть управляемого вывода внимания
  4. LEGO: Изучайте геометрию одновременно, просматривая видео

Повторная идентификация личности

  1. Передача данных по GAN для перекрытия разрыва домена для повторной идентификации личности
  2. Разнообразие регуляризованного пространственно-временного внимания для повторной идентификации человека на основе видео
  3. Чувствительное к позе встраивание для повторной идентификации человека с расширенным ранжированием по соседству
  4. Чувствительное к позе встраивание для повторной идентификации человека с расширенным перекрестным ранжированием по соседству
  5. Повторная идентификация транспортного средства с Приором пространства-времени
  6. https://zhuanlan.zhihu.com/p/34716633
  7. Реидентификация личности с помощью каскадных парных сверток
  8. Многоуровневая факторизационная сеть для повторной идентификации личности
  9. Attention-Aware Compositional Network для повторной идентификации личности
  10. Объединение идентификации и контекстного обучения для распознавания личности
  11. Случайное блуждание с глубоким перетасовыванием групп для повторной идентификации человека
  12. Передающееся совместное глубокое обучение атрибутов и идентичности для повторной идентификации человека без присмотра
  13. Гармоничная сеть внимания для повторной идентификации личности
  14. Эффективная и глубокая повторная идентификация личности с использованием многоуровневого сходства
  15. Повторная идентификация лица, допускающего передачу позы
  16. Адаптация стиля камеры для повторной идентификации личности
  17. Используйте неизвестное постепенно: повторная идентификация человека на основе видео с помощью пошагового обучения
  18. Сеть сопоставления двойного внимания для повторной идентификации личности на основе контекстно-зависимой последовательности признаков
  19. Устранение фоновой предвзятости для надежной повторной идентификации личности
  20. Простая идентификация по лучшим ограничениям: многократная повторная идентификация человека по эталонным ограничениям
  21. Многократная повторная идентификация пешеходов посредством последовательного принятия решений
  22. Сквозное глубокое сопоставление продуктов Кронекера для повторной идентификации личности
  23. Использование транзитивности для изучения моделей ре-идентификации человека с ограниченным бюджетом
  24. Глубокая реконструкция пространственных признаков для частичной повторной идентификации человека: подход без выравнивания
  25. Групповое последовательное обучение сходству с помощью Deep CRF для повторной идентификации личности

Распознавание активности:

  1. MiCT: смешанная 3D/2D сверточная трубка для распознавания действий человека
  2. Мгновенные облака: распознавание человеческой деятельности по неструктурированным характерным точкам
  3. Совместное обучение детекторов объекта и действия
  4. Функция управления оптическим потоком: быстрое и надежное представление движения для распознавания действий в видео [code]
  5. Нелинейные представления временного подпространства для распознавания деятельности
  6. Неконтролируемое изучение оптического потока с учетом окклюзии
  7. Оценка 2D/3D позы и распознавание действий с использованием многозадачного глубокого обучения
  8. Изучение скрытых суперсобытий для обнаружения нескольких действий в видео
  9. Временные галлюцинации для распознавания действий с помощью нескольких неподвижных изображений
  10. Когда ты будешь делать что? — Предвосхищение временных проявлений деятельности
  11. Геометрически управляемые сверточные нейронные сети для самоконтролируемого обучения видеопредставлению
  12. Наборы действий: слабо контролируемая сегментация действий без ограничений порядка
  13. Пристальный взгляд на пространственно-временные свертки для распознавания действий
  14. Распознавайте действия, выделяя компоненты динамики
  15. Слабо контролируемая локализация действий с помощью разреженной временной сети объединения
  16. PoseFlow: представление Deep Motion для понимания человеческого поведения в видео
  17. PoTion: представление движения в позе для распознавания действий
  18. Что мы узнали из глубоких репрезентаций для распознавания действий?
  19. Обнаружение и распознавание взаимодействия человека с объектом
  20. PWC-Net: CNN для оптического потока с использованием пирамиды, деформации и стоимостного объема
  21. LiteFlowNet: легкая сверточная нейронная сеть для оценки оптических потоков [code]
  22. На пути к универсальному представлению для распознавания невидимых действий

Движение и отслеживание:

  1. Контекстно-зависимое глубокое сжатие признаков для высокоскоростного визуального отслеживания
  2. Сквозное отслеживание корреляции потоков с пространственно-временным вниманием
  3. Лучшее из двух миров: сочетание CNN и геометрических ограничений для иерархической сегментации движения
  4. Контекстно-зависимое глубокое сжатие признаков для высокоскоростного визуального отслеживания
  5. Распределяемое согласованное сопоставление нескольких объектов
  6. Функции многоцелевого многокамерного отслеживания и повторной идентификации [код]
  7. Изучение пространственных регрессий для визуального отслеживания

Видео Понимание

  1. Сквозное обучение представлению движения для понимания видео [код]
  2. Сквозные плотные субтитры к видео с Masked Transformer
  3. Наложение субтитров на видео с помощью иерархического обучения с подкреплением
  4. Выделение актера и боевика из предложения
  5. Мелкие видео субтитры для спортивного повествования
  6. Сегментация действий со слабым наблюдением с итеративным заданием мягких границ
  7. Временные деформируемые остаточные сети для сегментации действий в видео
  8. Посещайте и взаимодействуйте: взаимодействие с объектами более высокого порядка для понимания видео
  9. Интерпретируемые субтитры к видео с помощью локализации, структурированной по траектории
  10. Ссылающиеся отношения [код]
  11. Двунаправленное внимательное слияние с определением контекста для плотных субтитров к видео [код]
  12. Что делает видео видео: анализ временной информации в видео, понимание моделей и наборов данных
  13. NeuralNetwork-Viterbi: платформа для слабо контролируемого видеообучения [code]
  14. HSA-RNN: адаптивная RNN с иерархической структурой для суммирования видео
  15. Обобщение видео с учетом точки зрения
  16. Совместная локализация и описание событий для плотного видеосубтитров
  17. M3: мультимодальное моделирование памяти для видеотитров
  18. Нелокальные нейронные сети
  19. Обучение без учителя и сегментация сложных действий из видео
  20. Глубокие пространственно-временные случайные поля для эффективной сегментации видео

Сегментация

  1. Учимся сегментировать все
  2. Семантическая сегментация со слабым наблюдением путем итеративного анализа общих признаков объекта

Оценка позы

  1. Обнаружение и отслеживание: эффективная оценка позы в видео [код]
  2. Слабый и частично контролируемый анализ частей человеческого тела с помощью передачи знаний с помощью позы [ код ]
  3. Учимся оценивать трехмерную позу и фигуру человека по одному цветному изображению
  4. Сквозное восстановление формы и позы человека
  5. DensePose: оценка плотной позы человека в дикой природе

Полу/Слабо контролируемое/неконтролируемое обучение

  1. Наращивание производительности семантической сегментации, контролируемой через Webly

Лицо

  1. Поиск крошечных лиц в дикой природе с помощью GAN
  2. Парный циклGAN

GAN

  1. Генерация изображения из графов сцен
  2. AttnGAN: мелкозернистая генерация текста в изображение с помощью состязательных сетей, генерирующих внимание
  3. MoCoGAN: разделение движения и контента для создания видео
  4. Социальная ГАН: социально приемлемые траектории с генеративно-состязательными сетями

VQA

  1. Обучение, задавая вопросы, Ишан Мишра и др.

Наборы данных

  1. AVA: набор видеоданных пространственно-временно локализованных атомарных визуальных действий
  2. DOTA: КРУПНОМАСШТАБНЫЙ НАБОР ДАННЫХ ДЛЯ ОБНАРУЖЕНИЯ ОБЪЕКТОВ НА АЭРОИЗОБРАЖЕНИЯХ
  3. MSMT17: https://arxiv.org/pdf/1711.08565.pdf
  4. COCO-Stuff: классы вещей и материалов в контексте
  5. WILDTRACK: многокамерный набор данных HD для плотного обнаружения пешеходов без сценария

Может быть интересно

  1. "Кто выпустил собак? Моделирование поведения собаки на основе визуальных данных»

Учебники

  1. http://interpretable-ml.org/cvpr2018tutorial/

Другие ссылки

  1. https://olgalitech.wordpress.com/2018/06/30/cvpr-2018-recap-notes-and-trends/#sceneAnalysis
  2. https://tc.computer.org/tcpami/cvpr-best-paper-award/