5 лучших проектов GAN (Generative Adversarial Networks) для студентов последнего года обучения информатике в…

В прошлом году, в ноябре 2020 года, я написал статью о пяти лучших проектах Generative Adversarial Networks для студентов и соискателей информатики. К счастью, вам, друзьям, он очень понравился, и вы выказали огромное уважение. Вот ссылка на эту статью, если вы ее пропустили: 5 лучших проектов GAN (Generative Adversarial Networks) для студентов последнего года обучения информатике.

В сегодняшней статье мы рассмотрим несколько действительно хороших генеративных рекламных проектов, которые все еще будут внедрены в 2021 году.

Прежде чем начать, давайте посмотрим, что такое GAN и почему так важно изучать GAN?

Генеративная состязательная сеть (GAN) - это подмножество машинного обучения, в котором мы загружаем обучающий набор данных в модель, и модель учится генерировать новые данные с теми же функциями, что и обучающий набор, которым она была загружена. Предположим, что GAN был обучен фотографированию собак и теперь может создавать новые фотографии собак, которые будут выглядеть хотя бы внешне аутентичными для наблюдателей. Хотя изначально сети GAN были предложены в качестве генеративной модели для методов обучения без учителя, GAN также оказались полезными для методов частично контролируемого обучения, полностью контролируемого обучения и обучения с подкреплением. За последние пару лет на рынке наблюдался стремительный рост приложений генерирующих состязательных сетей (GAN), что сделало эту технику успешной для высококачественного синтеза естественных изображений, задач увеличения данных, улучшения сжатия изображений и многого другого. приложения.

Я пропустил интересное приложение GAN или отличный проект по конкретному приложению GAN? Пожалуйста, дайте мне знать в комментариях.

В этом посте вы познакомитесь с пятью проектами GAN с открытым исходным кодом, которые могут быть полезны во многих отношениях, поэтому, без каких-либо дальнейших выплат, давайте приступим.

Хорошие теоретические знания - это прекрасно, но реализовать их в коде в проекте в реальном времени - совсем другое дело. Вы можете получить разные и неожиданные результаты в зависимости от разных проблем и наборов данных. Так что в качестве бонуса я также добавляю ссылки на различные курсы, которые очень помогли мне в моем путешествии по изучению науки о данных и машинного обучения. Я лично являюсь поклонником DataCamp, я начал с него и все еще учусь на DataCamp и продолжаю изучать новые курсы. У них серьезно есть несколько увлекательных курсов. Не пропустите их.

P.S: Я все еще использую DataCamp и продолжаю заниматься курсами в свободное время. Я на самом деле настаиваю, чтобы читатели попробовали любой из вышеперечисленных курсов в соответствии с их интересами, чтобы начать работу и заложить хорошую основу в машинном обучении и науке о данных. Лучшее в этих курсах от DataCamp - это то, что они объясняют их очень элегантно и по-разному, со сбалансированным акцентом на практических и концептуальных знаниях, и в конце всегда есть тематическое исследование. Эти курсы действительно стоят вашего времени и денег. Эти курсы, несомненно, помогут вам лучше понять и реализовать машинное обучение, а также реализовать его на Python или R. Я чертовски уверен, что вам это понравится, и я утверждаю это исходя из моего личного мнения и опыта.

Возвращаясь к теме -

1. Возвращение к жизни старых фотографий

Github: https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life

Официальный документ: https://arxiv.org/abs/2004.09484

Официальная страница: http://raywzy.com/Old_Photo/

Этот проект является официальной реализацией исследовательской работы Возвращение старых фотографий к жизни авторов Ziyu Wan, Bo Zhang, Dongdong Chen, Pan Zhang, Dong Chen, Цзин Ляо и Фан Вэнь.
В этой статье они предложили метод восстановления старых фотографий, которые страдают от серьезной деградации, с помощью подхода глубокого обучения с использованием новой сети трансляции триплетных доменов, используя реальные фотографии вместе с массивными синтетическими парами изображений.
Разработчики по-прежнему тратят время на решение некоторых общих проблем, таких как проблемы нехватки памяти, ограниченное разрешение, но не будут слишком сильно вовлекать в инженерные проблемы, такие как ускорение вывода, быстрое развертывание API и т. Д.
Код обучения доступен, и вы можете попробовать и изучить детали обучения.

2. Медитинг

Github: https://github.com/open-mmlab/mmediting

Официальная страница: http://raywzy.com/Old_Photo/

MMEditing - это набор инструментов для редактирования изображений и видео с открытым исходным кодом, основанный на PyTorch. Является частью проекта OpenMMLab.

Ключевые особенности MMediting:

Модульный дизайн: мы разбиваем структуру редактирования на различные компоненты, и можно легко создать настраиваемую структуру редактора, комбинируя различные модули.
Поддержка нескольких задач при редактировании: набор инструментов напрямую поддерживает популярные и современные рисование, матирование, супер -разрешение, и генерация задач.
Современное состояние: набор инструментов предоставляет самые современные методы рисования / матирования / сверхвысокого разрешения / генерации.

3. эйкост-ган

Github: https://github.com/mit-han-lab/anycost-gan

Официальный документ: https://arxiv.org/abs/2103.03243

Официальная страница: https://hanlab.mit.edu/projects/anycost-gan/

Anycost GANs - это проект для интерактивного синтеза и редактирования изображений, который может генерировать согласованные результаты при различных вычислительных бюджетах. Генераторы Anycost можно запускать при различных вычислительных затратах, используя разные конфигурации канала и разрешения. Субгенераторы обеспечивают высокую согласованность выходного сигнала по сравнению с полным генератором, обеспечивая быстрый предварительный просмотр.
С помощью (1) обучения с несколькими разрешениями на основе выборки, обучения с адаптивным каналом (2) и дискриминатора, управляемого генератором (3), мы добиваемся высокого качества и согласованности изображения при разных разрешениях и каналах.

Здесь мы можем использовать генератор Anycost для интерактивного редактирования изображений. Полному генератору требуется ~ 3 секунды для рендеринга изображения, что слишком медленно для редактирования. Используя генератор Anycost, мы можем обеспечить визуально похожий предварительный просмотр в 5 раз быстрее. После настройки мы нажимаем кнопку Завершить, чтобы синтезировать высококачественный окончательный результат. Зайдите здесь, чтобы увидеть полную демонстрацию.

4. CTGAN

Github: https://github.com/sdv-dev/CTGAN

Официальная страница: https://sdv.dev/

CTGAN - это набор генераторов синтетических данных на основе глубокого обучения для данных одной таблицы, которые могут учиться на реальных данных и генерировать синтетические клоны с высокой точностью.
В настоящее время эта библиотека реализует модели CTGAN и TVAE, предложенные в статье Моделирование табличных данных с использованием условной GAN. Для получения дополнительной информации об этих моделях, пожалуйста, ознакомьтесь с соответствующими руководствами пользователя:

Руководство пользователя CTGAN

Руководство пользователя TVAE

5. Переосмысление-рисование-MEDFE

Github: https://github.com/KumapowerLIU/Rethinking-Inpainting-MEDFE

Официальная страница: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123470715.pdf

Этот проект является официальной реализацией статьи «Переосмысление рисования изображений с помощью взаимного кодировщика-декодера с уравниванием функций» Хуню Лю, Бин Цзян, Ибин Сон, Вэй Хуан и Чао Ян.
Они используют функции CNN из глубоких и мелких слоев кодировщика для представления структур и текстур входного изображения соответственно. Объекты глубокого слоя отправляются в ветвь структуры, а элементы мелкого слоя отправляются в текстурированную ветвь. В каждой ветви они заполняют дыры в различных масштабах функций CNN. Заполненные элементы CNN из обеих ветвей объединяются, а затем выравниваются.
Эксперименты с эталонными наборами данных показывают, что предложенный метод эффективен для восстановления структур и текстур и превосходит современные подходы.

Спасибо, читатели, это накрытие с нашей стороны!

В будущих блогах я надеюсь представить вам еще больше интересных блогов о различных передовых инструментах и проектах машинного обучения и искусственного интеллекта.

До следующего раза!

Прочтите предыдущие блоги из серии GAN:

5 лучших проектов GAN (Generative Adversarial Networks) для студентов последнего года обучения информатике

Топ-5 проектов GAN (генерирующих состязательных сетей), в которых можно поиграть с человеческими лицами

Лучшие и лучшие бесплатные исследовательские работы и ресурсы по генерирующей состязательной сети (GAN), доступные на Github

Если вам понравилось читать эту статью, я уверен, что у нас схожие интересы и мы работаем в схожих отраслях. Итак, подключимся через LinkedIn и Github. Пожалуйста, не стесняйтесь отправить запрос на контакт!

5 лучших проектов GAN (Generative Adversarial Networks) для студентов последнего года обучения информатике в…

Прежде чем начать, давайте посмотрим, что такое GAN и почему так важно изучать GAN?

1. Возвращение к жизни старых фотографий

Github: https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life

Официальный документ: https://arxiv.org/abs/2004.09484

Официальная страница: http://raywzy.com/Old_Photo/

2. Медитинг

Github: https://github.com/open-mmlab/mmediting

Официальная страница: http://raywzy.com/Old_Photo/

Ключевые особенности MMediting:

3. эйкост-ган

Github: https://github.com/mit-han-lab/anycost-gan

Официальный документ: https://arxiv.org/abs/2103.03243

Официальная страница: https://hanlab.mit.edu/projects/anycost-gan/

4. CTGAN

Github: https://github.com/sdv-dev/CTGAN

Официальная страница: https://sdv.dev/

5. Переосмысление-рисование-MEDFE

Github: https://github.com/KumapowerLIU/Rethinking-Inpainting-MEDFE

Официальная страница: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123470715.pdf

Спасибо, читатели, это накрытие с нашей стороны!

До следующего раза!

Прочтите предыдущие блоги из серии GAN:

Вопросы по теме