В прошлом году, в ноябре 2020 года, я написал статью о пяти лучших проектах Generative Adversarial Networks для студентов и соискателей информатики. К счастью, вам, друзьям, он очень понравился, и вы выказали огромное уважение. Вот ссылка на эту статью, если вы ее пропустили: 5 лучших проектов GAN (Generative Adversarial Networks) для студентов последнего года обучения информатике.
В сегодняшней статье мы рассмотрим несколько действительно хороших генеративных рекламных проектов, которые все еще будут внедрены в 2021 году.
Прежде чем начать, давайте посмотрим, что такое GAN и почему так важно изучать GAN?
Генеративная состязательная сеть (GAN) - это подмножество машинного обучения, в котором мы загружаем обучающий набор данных в модель, и модель учится генерировать новые данные с теми же функциями, что и обучающий набор, которым она была загружена. Предположим, что GAN был обучен фотографированию собак и теперь может создавать новые фотографии собак, которые будут выглядеть хотя бы внешне аутентичными для наблюдателей. Хотя изначально сети GAN были предложены в качестве генеративной модели для методов обучения без учителя, GAN также оказались полезными для методов частично контролируемого обучения, полностью контролируемого обучения и обучения с подкреплением. За последние пару лет на рынке наблюдался стремительный рост приложений генерирующих состязательных сетей (GAN), что сделало эту технику успешной для высококачественного синтеза естественных изображений, задач увеличения данных, улучшения сжатия изображений и многого другого. приложения.
Я пропустил интересное приложение GAN или отличный проект по конкретному приложению GAN? Пожалуйста, дайте мне знать в комментариях.
В этом посте вы познакомитесь с пятью проектами GAN с открытым исходным кодом, которые могут быть полезны во многих отношениях, поэтому, без каких-либо дальнейших выплат, давайте приступим.
Хорошие теоретические знания - это прекрасно, но реализовать их в коде в проекте в реальном времени - совсем другое дело. Вы можете получить разные и неожиданные результаты в зависимости от разных проблем и наборов данных. Так что в качестве бонуса я также добавляю ссылки на различные курсы, которые очень помогли мне в моем путешествии по изучению науки о данных и машинного обучения. Я лично являюсь поклонником DataCamp, я начал с него и все еще учусь на DataCamp и продолжаю изучать новые курсы. У них серьезно есть несколько увлекательных курсов. Не пропустите их.
- Data-science-with-python
- Ученый-дата-ученый
- Ученый-машинное обучение с-р
- Ученый-машинное обучение с питоном
- Машинное обучение для всех
- Наука о данных для всех
- Инженер-дата-с-питоном
- Аналитик данных с питоном
- Основы больших данных через pyspark
P.S: Я все еще использую DataCamp и продолжаю заниматься курсами в свободное время. Я на самом деле настаиваю, чтобы читатели попробовали любой из вышеперечисленных курсов в соответствии с их интересами, чтобы начать работу и заложить хорошую основу в машинном обучении и науке о данных. Лучшее в этих курсах от DataCamp - это то, что они объясняют их очень элегантно и по-разному, со сбалансированным акцентом на практических и концептуальных знаниях, и в конце всегда есть тематическое исследование. Эти курсы действительно стоят вашего времени и денег. Эти курсы, несомненно, помогут вам лучше понять и реализовать машинное обучение, а также реализовать его на Python или R. Я чертовски уверен, что вам это понравится, и я утверждаю это исходя из моего личного мнения и опыта.
Возвращаясь к теме -
1. Возвращение к жизни старых фотографий
Github: https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life
Официальный документ: https://arxiv.org/abs/2004.09484
Официальная страница: http://raywzy.com/Old_Photo/
- Этот проект является официальной реализацией исследовательской работы Возвращение старых фотографий к жизни авторов Ziyu Wan, Bo Zhang, Dongdong Chen, Pan Zhang, Dong Chen, Цзин Ляо и Фан Вэнь.
- В этой статье они предложили метод восстановления старых фотографий, которые страдают от серьезной деградации, с помощью подхода глубокого обучения с использованием новой сети трансляции триплетных доменов, используя реальные фотографии вместе с массивными синтетическими парами изображений.
- Разработчики по-прежнему тратят время на решение некоторых общих проблем, таких как проблемы нехватки памяти, ограниченное разрешение, но не будут слишком сильно вовлекать в инженерные проблемы, такие как ускорение вывода, быстрое развертывание API и т. Д.
- Код обучения доступен, и вы можете попробовать и изучить детали обучения.
2. Медитинг
Github: https://github.com/open-mmlab/mmediting
Официальная страница: http://raywzy.com/Old_Photo/
- MMEditing - это набор инструментов для редактирования изображений и видео с открытым исходным кодом, основанный на PyTorch. Является частью проекта OpenMMLab.
Ключевые особенности MMediting:
- Модульный дизайн: мы разбиваем структуру редактирования на различные компоненты, и можно легко создать настраиваемую структуру редактора, комбинируя различные модули.
- Поддержка нескольких задач при редактировании: набор инструментов напрямую поддерживает популярные и современные рисование, матирование, супер -разрешение, и генерация задач.
- Современное состояние: набор инструментов предоставляет самые современные методы рисования / матирования / сверхвысокого разрешения / генерации.
3. эйкост-ган
Github: https://github.com/mit-han-lab/anycost-gan
Официальный документ: https://arxiv.org/abs/2103.03243
Официальная страница: https://hanlab.mit.edu/projects/anycost-gan/
- Anycost GANs - это проект для интерактивного синтеза и редактирования изображений, который может генерировать согласованные результаты при различных вычислительных бюджетах. Генераторы Anycost можно запускать при различных вычислительных затратах, используя разные конфигурации канала и разрешения. Субгенераторы обеспечивают высокую согласованность выходного сигнала по сравнению с полным генератором, обеспечивая быстрый предварительный просмотр.
- С помощью (1) обучения с несколькими разрешениями на основе выборки, обучения с адаптивным каналом (2) и дискриминатора, управляемого генератором (3), мы добиваемся высокого качества и согласованности изображения при разных разрешениях и каналах.
- Здесь мы можем использовать генератор Anycost для интерактивного редактирования изображений. Полному генератору требуется ~ 3 секунды для рендеринга изображения, что слишком медленно для редактирования. Используя генератор Anycost, мы можем обеспечить визуально похожий предварительный просмотр в 5 раз быстрее. После настройки мы нажимаем кнопку Завершить, чтобы синтезировать высококачественный окончательный результат. Зайдите здесь, чтобы увидеть полную демонстрацию.
4. CTGAN
Github: https://github.com/sdv-dev/CTGAN
Официальная страница: https://sdv.dev/
- CTGAN - это набор генераторов синтетических данных на основе глубокого обучения для данных одной таблицы, которые могут учиться на реальных данных и генерировать синтетические клоны с высокой точностью.
- В настоящее время эта библиотека реализует модели CTGAN и TVAE, предложенные в статье Моделирование табличных данных с использованием условной GAN. Для получения дополнительной информации об этих моделях, пожалуйста, ознакомьтесь с соответствующими руководствами пользователя:
5. Переосмысление-рисование-MEDFE
Github: https://github.com/KumapowerLIU/Rethinking-Inpainting-MEDFE
Официальная страница: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123470715.pdf
- Этот проект является официальной реализацией статьи «Переосмысление рисования изображений с помощью взаимного кодировщика-декодера с уравниванием функций» Хуню Лю, Бин Цзян, Ибин Сон, Вэй Хуан и Чао Ян.
- Они используют функции CNN из глубоких и мелких слоев кодировщика для представления структур и текстур входного изображения соответственно. Объекты глубокого слоя отправляются в ветвь структуры, а элементы мелкого слоя отправляются в текстурированную ветвь. В каждой ветви они заполняют дыры в различных масштабах функций CNN. Заполненные элементы CNN из обеих ветвей объединяются, а затем выравниваются.
- Эксперименты с эталонными наборами данных показывают, что предложенный метод эффективен для восстановления структур и текстур и превосходит современные подходы.
Спасибо, читатели, это накрытие с нашей стороны!
В будущих блогах я надеюсь представить вам еще больше интересных блогов о различных передовых инструментах и проектах машинного обучения и искусственного интеллекта.
До следующего раза!
Прочтите предыдущие блоги из серии GAN:
Если вам понравилось читать эту статью, я уверен, что у нас схожие интересы и мы работаем в схожих отраслях. Итак, подключимся через LinkedIn и Github. Пожалуйста, не стесняйтесь отправить запрос на контакт!