Сверточная генерирующая состязательная сеть: генератор изображений «EyeGaze»

Генеративная состязательная сеть (GAN) - это система, состоящая из двух нейронных сетей: генератора и дискриминатора. Дискриминатор принимает экземпляр данных в качестве входных данных и классифицирует его как «настоящий» или «фальшивый» по отношению к набору обучающих данных. Генератор берет гауссовский шум и преобразует его в синтетическую выборку данных с целью обмануть дискриминатор. Дискриминатор учится классифицировать образцы как настоящие или поддельные. Генератор учится на ошибках в неудачных попытках обмануть дискриминатор.

Чтобы проверить возможности состязательных методов для генеративных моделей, мы разработали простую GAN в Keras, которая использует слои сверточной нейронной сети для генерации и различения изображений человеческих глаз из набора данных EyeGaze, найденного на kaggle.com. Щелкните здесь, чтобы получить доступ к ядру, чтобы просмотреть и запустить наш код.

Результаты

Вот пример изображения, найденного в наборе данных «EyeGaze»:

Следующий GIF показывает изображения, которые наша модель сгенерировала из одного случайного начального числа за 105 периодов обучения.

Ключевые выводы из разработки модели:

Для сходимости нашей модели была необходима пакетная нормализация между слоями.
Для правильной работы пакетной нормализации дискриминатор должен использовать отдельные пакеты для реальных и поддельных наборов данных.
Установка гиперпараметра бета-1 оптимизации Адама на 0,5 дала лучшую сходимость, чем значение по умолчанию 0,9.
Генератор необходимо обучать чаще, и для него требуется значительно меньшая скорость обучения по сравнению с дискриминатором, поскольку дискриминатор имеет значительно меньшую сложность вывода для обучения.

Мы показали, что очень простая генеративная нейронная сеть может давать убедительные результаты. Дальнейшие улучшения базовой генеративной состязательной архитектуры позволят создавать мощные синтетические данные для любого типа данных, включая изображения, видео, временные ряды, естественный язык и реляционные базы данных.

Masala.AI

Команда специалистов по науке о данных Mindboard исследует передовые технологии инновационными способами для создания оригинальных решений, включая линейку продуктов Masala.AI. Masala предоставляет услуги по оценке мультимедийного контента, такие как vRate, расширение браузера, которое обнаруживает и блокирует контент для взрослых с настраиваемыми настройками чувствительности. Расширение для браузера vRate доступно для загрузки в Интернет-магазине Chrome. Посетите www.masala.ai для получения дополнительной информации.

Сверточная генерирующая состязательная сеть: генератор изображений «EyeGaze»

Результаты

Masala.AI

Вопросы по теме