В этой статье я перечисляю 5 проектов глубокого обучения для создания изображений. Вы можете увидеть полный список всех проектов глубокого обучения на DeepLink.

1. Создание человеческих лиц с помощью GAN

Этот проект основан на статье Прогрессивное развитие сетей GAN для повышения качества, стабильности и разнообразия. Ключевая идея состоит в том, чтобы постепенно наращивать как генератор, так и дискриминатор: начиная с низкого разрешения, мы добавляем новые слои, моделирующие все более мелкие детали по мере обучения. Ознакомьтесь с этим туториалом, чтобы реализовать проект в TensorFlow.

Для других реализаций и ссылок отметьте это.

2. Перевод изображения в изображение. Превратите зебр в лошадей, зиму в лето или кошек в собак.

CycleGAN и Pix2Pix используют исследование преобразования непарного изображения в изображение с использованием циклически согласованных состязательных сетей для изучения сопоставлений изображения X с изображением Y для создания определенных изображений из заданного изображения.
Например.

  • Превращение Моне в Томаса Кинкейда
  • Возрождение древних городов
  • Трансфигурация животных — черные медведи в панд, птицы в разные виды и т. д.
  • перевести портреты в кукольное лицо
  • Кошки ↔ Собаки
  • Зима к лету

Подробнее об этом проекте смотрите здесь

3. 3D-реконструкция лица из 2D-изображения

Трехмерная реконструкция лица — фундаментальная проблема компьютерного зрения чрезвычайной сложности. Современные системы часто предполагают наличие нескольких изображений лица (иногда от одного и того же субъекта) в качестве входных данных и должны решать ряд методологических проблем, таких как установление плотных соответствий между крупными позами лица, выражениями и неравномерным освещением. Как правило, эти методы требуют сложных и неэффективных конвейеров для построения и подгонки моделей. В этой работе мы предлагаем устранить многие из этих ограничений путем обучения сверточной нейронной сети (CNN) на соответствующем наборе данных, состоящем из 2D-изображений и 3D-моделей лица или сканов. Наша CNN работает только с одним 2D-изображением лица, не требует точного выравнивания и не устанавливает плотного соответствия между изображениями, работает с произвольными позами и выражениями лица и может использоваться для реконструкции всей 3D-геометрии лица (включая невидимые части лица). лицо), минуя построение (во время обучения) и подгонку (во время тестирования) 3D Morphable Model. Мы достигаем этого с помощью простой архитектуры CNN, которая выполняет прямую регрессию объемного представления 3D-геометрии лица из одного 2D-изображения. Мы также демонстрируем, как родственная задача локализации ориентиров лица может быть включена в предлагаемую структуру и помогает улучшить качество реконструкции, особенно для случаев больших поз и выражений лица.

Проверьте этот пост для получения дополнительной информации о проекте.

Это мой первый пост в блоге, поэтому, пожалуйста, оставляйте свои предложения. Скоро последуют другие посты.