Недавно я был на IWCV — воркшопе только по приглашению, без бумажных изданий в Модене, Италия.

По словам организаторов,

Мы заметили, что полезность CVPR для обмена продуманными идеями и обсуждения становится все меньше, и запустили IWCV. И я попросил спикеров подготовить не обычные для них доклады

И это было круто. Много «необычных» докладов от первоклассных исследователей CV действительно вдохновляли. Место проведения тоже было отличным — Модена — это 1000-летний город, где Энцо Феррари основал свою знаменитую компанию.

Но давайте сразу к интересным и актуальным (для меня!) докладам.

  1. Билл Фримен выступил с докладом Ищу, чтобы послушать. Основная идея — изображение помогает распознавать звуки и наоборот. Есть даже явления, когда люди в очках стали лучше слышать. Результаты были впечатляющими… и от CVPR отказались. Они повторно представили SIGGRAPH и получили устные ответы.

2. Нил Лоуренс классно рассказал о неопределенности в глубоком обучении. В частности, он настаивал на том, что функцию потерь следует использовать в прямом смысле сколько мы платим за ошибку, и показал, что необходимо добавить неопределенность в простую линейную регрессию, чтобы результат стал логичным. Вот некоторые

Эволюция — это не выживание наиболее приспособленных, это невыживание неприспособленных…
Использование логарифмического правдоподобия — это просто откладывание решения по функции потерь…
Хорошая вещь — это минимизация свободы — когда у вас нет других вариантов, кроме как правильный…

3. Стефан Рот представил основанный на восприятии объединение с сохранением деталей (DPP) и способ распространения дисперсии в обычных CNN. DPP — это обобщение среднего и максимального пула, более общее, чем пул GeM :)

4. Йоав Ю. Шехнер представил способ разложения источников света на изображении путем оценки фазы переменного тока.

Также был разговор о новом датчике CMOS, который делает такие вещи внутри, так здорово, например. получение формы живого объекта.

5. Рамин Забих показал, что задача «сшивки панорамы» далека от решения и представил два метода, как работать с объектами и как перемещать вещи. Конкретно — обнаруживать :) Еще интересно, что по его словам, самым современным является Photoshop CS18, а разница с CS14 огромна.
И мой урок из его выступления — не зацикливайтесь на общих задачах. определения, посмотрите на реальные варианты использования и на то, что делают пользователи.

6. Стив Зейтц классно выступил на тему Сделай сам 3D-дисплей из iPad + пластик. То видео не из мастерской, но технология та же. Довольно удивительно :)

7. CNN для аэродинамики от Паскаля Фуа было круто. Простая идея: научить CNN имитировать симулятор и/или реальные аэродинамические данные. Теперь у вас есть быстрая и дифференцируемая модель, поэтому вы можете напрямую оптимизировать форму своего крыла/лодки/байка. Это использовалось для поступления в EPFL на некоторые университетские соревнования по скоростным лодкам.

8. Глубокое внутреннее обучение от группы Михал Ирани. А Михал просто великолепен. Кто сказал, что нельзя тренироваться на тестовом наборе в тестовое время?

Вы можете, и это единственное тестовое время обучения, которое быстрее (для высокого разрешения) и лучше для сверхвысокого разрешения и шумоподавления, чем GAN и другие ResNet. Идея состоит в том, чтобы использовать самоподобие фрактального изображения — старая идея ее группы.

Были и более интересные разговоры, но оставим их для следующего поста :)