Netflix проделал мастерскую работу по структурированию всех своих данных о фильмах с помощью тегов, атрибутов и категорий. В результате, если вы хотите посмотреть постапокалиптическую романтическую комедию, Netflix, вероятно, предложит вам Shaun of the Dead или Zombieland.

Представьте, что метаданные, описанные в статье, доступны для всех продуктов на планете. Это было бы не только очень полезно для рекомендации продуктов, которые могут вам понравиться, но и для более точного таргетинга объявлений и предоставления более релевантных результатов поиска. Поскольку мы видим, что мобильные технологии и Интернет вещей становятся все более влиятельными в том, как мы делаем покупки, этот тип метаданных или производной информации о продукте станет критически важным. Но пометить и классифицировать миллиарды продуктов — непростая задача. Ручной плюс алгоритмический подход Netflix, вероятно, должен быть почти полностью алгоритмическим при работе с миллиардами продуктов.

Данные могут быть собраны или получены. Полученные метаданные — это то, что поможет обеспечить интуитивный и целенаправленный опыт покупок в будущем, описанный выше. Одно дело собирать информацию со всего Интернета. Что происходит тогда? Вам нужно ответить на такие вопросы, как: если есть два продукта, продаваемых в разных магазинах, как вы можете программно определить, что один из них такой же, как другой? Это вариант по размеру или цвету? Какие тенденции наблюдаются в ценообразовании на этот продукт? Как классифицируется этот продукт? Какова самая узкая подкатегория, в которую он может вписаться? Какими способами можно описать этот продукт?

Именно здесь становятся важными методы машинного обучения. Получение метаданных из огромного количества информации о продуктах — одна из областей, в которые мы инвестируем. Для нас важно не только собирать высококачественную информацию о продуктах, где бы мы ни находились, но и получать метаданные, которые можно использовать. для более глубокого анализа и понимания. В наши дни данные должны сочетаться с алгоритмами, чтобы получать еще больше информации, которая может быть полезной.

Первоначально опубликовано на Indix.