В этой статье я перечисляю 5 проектов глубокого обучения для создания изображений. Вы можете увидеть полный список всех проектов глубокого обучения на DeepLink.
1. Создание человеческих лиц с помощью GAN
Этот проект основан на статье Прогрессивное развитие сетей GAN для повышения качества, стабильности и разнообразия. Ключевая идея состоит в том, чтобы постепенно наращивать как генератор, так и дискриминатор: начиная с низкого разрешения, мы добавляем новые слои, моделирующие все более мелкие детали по мере обучения. Ознакомьтесь с этим туториалом, чтобы реализовать проект в TensorFlow.
Для других реализаций и ссылок отметьте это.
2. Перевод изображения в изображение. Превратите зебр в лошадей, зиму в лето или кошек в собак.
CycleGAN и Pix2Pix используют исследование преобразования непарного изображения в изображение с использованием циклически согласованных состязательных сетей для изучения сопоставлений изображения X с изображением Y для создания определенных изображений из заданного изображения.
Например.
- Превращение Моне в Томаса Кинкейда
- Возрождение древних городов
- Трансфигурация животных — черные медведи в панд, птицы в разные виды и т. д.
- перевести портреты в кукольное лицо
- Кошки ↔ Собаки
- Зима к лету
Подробнее об этом проекте смотрите здесь
3. 3D-реконструкция лица из 2D-изображения
Трехмерная реконструкция лица — фундаментальная проблема компьютерного зрения чрезвычайной сложности. Современные системы часто предполагают наличие нескольких изображений лица (иногда от одного и того же субъекта) в качестве входных данных и должны решать ряд методологических проблем, таких как установление плотных соответствий между крупными позами лица, выражениями и неравномерным освещением. Как правило, эти методы требуют сложных и неэффективных конвейеров для построения и подгонки моделей. В этой работе мы предлагаем устранить многие из этих ограничений путем обучения сверточной нейронной сети (CNN) на соответствующем наборе данных, состоящем из 2D-изображений и 3D-моделей лица или сканов. Наша CNN работает только с одним 2D-изображением лица, не требует точного выравнивания и не устанавливает плотного соответствия между изображениями, работает с произвольными позами и выражениями лица и может использоваться для реконструкции всей 3D-геометрии лица (включая невидимые части лица). лицо), минуя построение (во время обучения) и подгонку (во время тестирования) 3D Morphable Model. Мы достигаем этого с помощью простой архитектуры CNN, которая выполняет прямую регрессию объемного представления 3D-геометрии лица из одного 2D-изображения. Мы также демонстрируем, как родственная задача локализации ориентиров лица может быть включена в предлагаемую структуру и помогает улучшить качество реконструкции, особенно для случаев больших поз и выражений лица.
Проверьте этот пост для получения дополнительной информации о проекте.