Наука о данных в реальном мире

Как создать искусственный интеллект для создания модных изображений

Почему каждый модный сайт должен использовать машинное обучение, как работать с таксономией и данными и как создать систему распознавания изображений с помощью Flows

В этом посте я покажу вам, как вы можете построить свою систему признания моды. Я сосредоточусь на обуви, однако этот подход можно применить и к другой одежде. Такой подход подходит не только в сфере моды. Хорошая новость в том, что это руководство не содержит кода!

Почему машинное обучение и мода?

Есть несколько причин: лучший пользовательский интерфейс, увеличение количества кликов, вовлеченности, доходов ... Вот большое исследование, какие наиболее важные функции в модной розничной торговле должны быть в каждом магазине:

Как видите, некоторые функции полностью основаны на машинном обучении и визуальном ИИ. Большинство магазинов модной одежды закрыты по всему миру из-за карантина COVID-19, поэтому электронная коммерция сейчас является наиболее важной частью розничной торговли. Если у вас есть сайт магазина модной одежды, подумайте о внедрении некоторых функций машинного обучения. Это может помочь и вашему бизнесу! Сейчас самое время улучшить свой цифровой продукт.

Наиболее распространенные варианты использования визуального ИИ в моде:

  • поиск: покажите своим клиентам самые похожие товары
  • теги: сделайте свою коллекцию товаров более доступной для поиска с помощью улучшенной категоризации
  • Снимай и снимай: позвольте своим покупателям сфотографировать одежду и найти ее в вашем магазине
  • виртуальная раздевалка: как я могла бы выглядеть с этим платьем?
  • Измерение стопы: мне подходят эти туфли?
  • и многие другие

Таксономия

Подумайте о таксономии - один из самых важных шагов! И это очень сложно!

Прежде чем мы начнем, мы должны определить нашу таксономию системы распознавания обуви - ›другими словами, какие марки мы хотели бы распознавать. Когда мы работаем с обувью, существуют тысячи стилей с сотнями различных узоров. Например, кроссовки для отдыха, а есть кроссовки для бега. Вся таксономия обуви может быть сложной, поскольку мы можем распознавать стиль, цвет, бренд, узор, размер каблука,…. Как мы уже говорили ранее, сам стиль может иметь множество вариантов. Всегда начинайте с чего-нибудь простого!

Когда вы работаете с доменами, где возможны тысячи вариантов (мода, недвижимость,…), будьте очень осторожны. Проблема с таксономией моды в том, что не существует единого стандарта. Каждый магазин одежды использует разные названия и категории. Достаточно заглянуть на сайт ASOS или urbanoutfitters.com. Мой совет - не изобретайте колесо. Просто посмотрите на некоторые из самых известных магазинов одежды, узнайте, как они это делают, и вдохновитесь.

Стиль: допустим, мы можем распознать элегантность, досуг и спорт. Если мы узнаем Elegant, то мы сможем разделить эту категорию по полу. В большинстве случаев женская элегантная обувь выглядит немного иначе, чем мужская. Это немного сложнее сказать в категории «Досуг» и еще труднее сказать в категории «Спорт / Кроссовки». Большинство элегантных женских туфель можно было узнать по высоте каблука.

Подкатегория: если мы узнаем элегантную обувь, мы можем сказать, есть ли там мокасины, ботинки или лодочки. Если мы говорим о спорте, то мы можем разделить их на кроссовки, бег, походы.

Цвет: красный, зеленый, синий, желтый, черный, белый, оранжевый,…. Я бы рекомендовал предсказывать только основные цвета. Чем больше цветов вы введете, тем более несовместимыми будут ваши ярлыки с изображениями. Маркировать продукцию по цвету бывает непросто! Каждая картинка может немного отличаться на разных экранах. В новых MacBook используется технология истинных тонов, позволяющая настроить отображение более теплых цветов в зависимости от освещения. Если вы работаете в команде, люди могут немного по-другому различать цвета.

Бренд. Бренд некоторых кроссовок можно легко узнать. Кроссовки Adidas, Nike, Puma в большинстве случаев содержат большой логотип или другие визуальные элементы. В элегантной обуви может быть намного сложнее. Может быть, элегантная обувь от Tommy Hilfiger могла быть проще, потому что логотип бренда почти всегда можно увидеть даже на обуви.

Собрав все это вместе, наша простая таксономия обуви может быть записана в виде иерархии и решена с помощью иерархической классификации. Иерархическая классификация означает, что мы будем вызывать несколько моделей, и если мы прогнозируем некоторые метки, мы также можем вызвать другую модель, в зависимости от предсказанной метки. Так, например, если мы спрогнозируем метку ELEGANT, мы вызовем модель для прогнозирования размера каблука. Если мы предсказываем этикетку SPORT, то можем назвать другие модели.

Данные и машинное обучение

Системы машинного обучения предвзято относятся к полученным данным.

Проще говоря, машинное обучение - это метод оптимизации, который пытается извлечь важные знания из ваших данных.

Подумать об этом - еще один важный шаг при работе с искусственным интеллектом / машинным обучением. Ваша система будет использоваться только на фотографиях товаров: фон в большинстве случаев чистый или фотографии сделаны профессиональными камерами? Тогда ваш набор данных должен содержать похожие изображения.

Если вы работаете над мобильным приложением, которое будет делать снимки обуви с реальным фоном, включите это изображение в свой набор данных. Получить изображения «реального мира» может быть намного сложнее, однако ваш продукт может быть более ценным, если он будет хорошо работать с изображениями «худшего качества». Должно ли ваше приложение работать во всех возможных настройках? Тогда у вас должен быть качественный и сбалансированный набор данных fo.

Нам нужно скачать наши данные. Мы можем использовать поиск в Google или Bing и загружать некоторые данные вручную со страницы изображений. Если вы умеете программировать, то можете написать скрипт для загрузки изображений из google или bing. Вы можете использовать, например, библиотеку scrapy для сканирования изображений со страниц магазина. Для не кодировщиков - ›Также есть отличный вариант использовать плагины Chrome или Firefox для получения изображений с веб-сайтов.

Сколько изображений нужно загрузить для каждого ярлыка?

Сосредоточьтесь на итеративном подходе, 50 изображений на этикетку - это неплохо для начала обучения вашей модели, если вы используете технику трансферного обучения. Если результаты неудовлетворительны, продолжайте увеличивать количество изображений. Чем сложнее ваша таксономия, тем больше изображений вам понадобится. Иногда требуются сотни изображений на этикетку.

Создавайте свои модели

Поскольку это руководство для людей, не имеющих опыта машинного обучения и программирования, мы собираемся создать систему распознавания на платформе Ximilar. Не волнуйтесь, это очень просто.

Войдите в Ximilar App и нажмите на службу распознавания изображений. Перейдите на страницу задач и создайте новую задачу. Затем выберите задачу категоризации и создайте и подключите метки для задачи. Задача представляет собой модель машинного обучения / глубокого обучения.

Следующим шагом будет обучение вашей модели. Просто нажмите на кнопку ПОЕЗД.

Таким образом, мы можем создавать другие задачи для цвета, материала, узора и т. Д.

Свяжите свои задачи / модели с иерархией с помощью Flow

Теперь мы собираемся использовать инновационную функцию, которая позволяет объединять модели машинного обучения в таксономию / иерархию за несколько кликов. Из панели управления перейдите в сервис Flows и создайте новый поток. Затем создайте «операцию списка» в качестве первого шага. Затем добавьте «Селектор веток» в задачу распознавания стиля с помощью задачи «Пяточка». Наконец, добавьте в список задачи цвета, категории, пола и бренда.

Развернуть

Вся ваша система развернута за одной простой в использовании конечной точкой API с Flows! Вы можете подключить к API свое мобильное приложение или сайт. Окончательный вариант приложения может выглядеть так:

Обобщение

Машинное обучение повсюду в розничной торговле, помогая увеличить доход и улучшить взаимодействие с пользователем.

  • Всегда думайте о своей таксономии и тегах при создании системы машинного обучения.
  • Будьте совместимы со своими данными и ярлыками. Выполните инкрементную разработку, начните с чего-нибудь простого, а затем продолжайте более сложными решениями.
  • Вы можете использовать Потоки для построения иерархической системы классификации в несколько кликов.

Ознакомьтесь с нашей ДЕМО для нашей системы Visual Fashion AI. Если вы хотите создать детектор модной одежды, см. Следующий пост в блоге (он о микроконтроллерах, но применим в моде точно так же):