Как специалист по данным и заядлый меломан, я горжусь своим шестилетним членством в Spotify Premium. Когда я присоединился к платформе в 2014 году, Spotify только что приобрела The Echo Nest, стартап, специализирующийся на машинном обучении и его приложениях к музыке. С тех пор компания сосредоточилась на исследованиях и развитии алгоритмически созданных плейлистов и инвестировала в них.

С самого начала Spotify понял кое-что очень важное об индустрии потоковой передачи музыки: важен не размер вашего каталога, а то, что вы с ним делаете. Музыка со всего мира доступна на кончике пальца, и пользователи, желающие открыть для себя новую музыку, сталкиваются с трудной задачей разобраться в шуме. Проблема в том, где вы идете искать песню, если не знаете, какую именно песню вы ищете? Это фундаментальный вопрос, над которым работают ученые в области машинного обучения в музыкальной индустрии, и Spotify лидирует в этой гонке.

На протяжении многих лет новаторские инновации компании в области технологий персонализации и рекомендаций позволили ей опередить своих конкурентов. Если вас не интересуют технические особенности, лежащие в основе механизма поиска музыки Spotify, перейдите к разделу 2, чтобы начать пожинать плоды их преимуществ. Если вы хотите увидеть волшебство, происходящее за кулисами, читайте дальше.

(1) Как работают персонализированные рекомендательные системы

Рекомендательные системы были разработаны исходя из осознанного предположения, что персонализация пользовательского опыта улучшает его. По сути, они стремятся стимулировать потребление, помогая людям находить новые и соответствующие продукты.

Определить набор «новых продуктов» для кого-либо довольно просто: это набор песен, которые пользователь Spotify никогда не транслировал, набор статей, которые подписчик New York Times никогда не читал. или рестораны, в которых пользователь OpenTable никогда не обедал. Однако определить набор «релевантных продуктов» немного сложнее. А именно, что делает продукт «актуальным» для данного пользователя? Вот где на помощь приходит машинное обучение.

Здесь мы рассмотрим 3 основных типа рекомендательных систем: (1) на основе контента, (2) на основе пользователей (или «совместная фильтрация») и (3) гибриды (которые сочетают в себе первые два подхода). Фундаментальное различие между этими моделями заключается в том, как они определяют релевантность продукта.

(I) Системы рекомендаций на основе контента

Этот метод измеряет релевантность продукта в зависимости от пользовательских предпочтений и характеристик продукта. Продукт считается «релевантным» для данного пользователя, если его атрибуты соответствуют предпочтениям пользователя.

В зависимости от доступных данных пользовательские предпочтения могут быть явными (предпочтение местоположения в Tinder) или неявными (нажатие на объявление в Instagram). Точно так же характеристики продукта могут быть явными (рейтинг в Uber) или неявными (сюжет фильма Netflix). Практическое применение этой рекомендательной системы может быть разработано для StubHub, поскольку разумно полагать, что пользователь был бы заинтересован в покупке билетов на концерт Билли Эйлиш, если бы он просматривал их.

Однако при внедрении рекомендательной системы на основе контента следует учитывать несколько вопросов. Во-первых, при отсутствии явных атрибутов пользователя/элемента интерпретация неявных атрибутов может быть сложной задачей. Во-вторых, производительность зависит от характера продуктов, которые вы пытаетесь порекомендовать. Например, Amazon, вероятно, не сулит ничего хорошего с этим рекомендателем, поскольку маловероятно, что покупатель, ранее купивший фен, будет заинтересован в покупке второго такого же фена.

(II) Пользовательские рекомендательные системы

Этот подход, обычно называемый «совместной фильтрацией», измеряет релевантность продукта в зависимости от поведения пользователя. Он основан на предположении, что пользователи, которые согласились в прошлом, вероятно, согласятся снова в будущем, и могут работать, сравнивая либо элементы, либо пользователей.

  • Сравнение элементов: предположим, что элементы x, y и z похожи в том смысле, что что они были куплены одними и теми же пользователями. Затем, если пользователь покупает товары x и y, мы можем предположить, что он, скорее всего, рассмотрит возможность покупки товара zтоже.
  • Сравнение людей: предположим, что пользователи A, B и C похожи в том смысле, что что они купили одни и те же предметы. Затем, если пользователи A и Bпокупают новый товар, мы можем предположить, что пользовательCвероятно, тоже рассмотрит возможность его покупки.

Важно отметить, что этот подход страдает от проблемы «холодного запуска», которая заключается в том, что он не предназначен для рекомендации продуктов новым пользователям. Распространенным применением коллаборативной фильтрации являются социальные сети: если все ваши близкие друзья на Facebook являются друзьями пользователя X, вы, вероятно, тоже знаете пользователя X.

(III) Гибридные рекомендательные системы

Гибридный подход измеряет релевантность продукта как функцию как поведения пользователя, так и характеристик пользователя/элемента. Таким образом, в основном он сочетает в себе методы, используемые двумя вышеупомянутыми рекомендательными системами.

Spotify произвел революцию в системах музыкальных рекомендаций, разработав невероятно сложные гибридные алгоритмы. Чтобы определить, понравится ли песня пользователю, классификаторы логистической регрессии обычно учитывают 3 основных признака. Во-первых, это совместная фильтрация информации, например, нравится ли эта песня другим пользователям с похожими шаблонами потоковой передачи. Следующие два — это неявные атрибуты, основанные на содержании, в том числе: лирическое содержание (с использованием обработки естественного языка) и аудиофункции (с использованием аудиоанализа глубокого обучения).

В итоге…

2. Как максимально использовать алгоритмы Spotify

Чтобы вы могли транслировать как можно больше контента как можно дольше, Spotify разработал современные функции поиска музыки. Хотя мне нравится это приложение, я должен признать, что у него не самый дружелюбный пользовательский интерфейс, поэтому я не удивлюсь, если вы узнаете здесь пару новых трюков. Первые две функции ориентированы на рекомендации, а последние две — на персонализацию.

(1) Радио Spotify

Не знаете, какие песни слушать, но знаете, какое у вас настроение? Без проблем. Просто выберите исполнителя, альбом, плейлист или песню по вашему выбору, и пусть Spotify Radio создаст коллекцию песен, чтобы заполнить тишину. Они регулярно обновляются, чтобы поддерживать актуальность, и вы даже можете сохранить их в своей библиотеке.

Лично я хочу отметить, что эта функция, несомненно, произвела революцию в моем восприятии музыки. Помимо того, что это отличный инструмент для поиска музыки в определенном жанре, я также использую ее, когда хочу воспроизвести фоновую музыку. Радио обеспечивает согласованный с жанром поток прослушивания, так что я могу сосредоточиться на том, что я делаю, а не на следующей песне. Он редко когда-либо разочаровывает, и это бесконечно долго.

(2) «Поклонникам также нравится»

Вы можете использовать Spotify почти так же, как и LinkedIn. За исключением того, что вместо того, чтобы перемещаться по сети профессионалов с похожим опытом и навыками, вы просматриваете артистов с похожим музыкальным вкусом и пересекающимися фан-базами. Для начала зайдите в профиль своего любимого исполнителя, чтобы посмотреть, что «поклонникам также нравится», где вы найдете список из 20 похожих исполнителей.

И пока вы этим занимаетесь, я предлагаю заглянуть на страницу «О нас» для получения некоторой справочной информации об артисте и на вкладку «Концерт» для предстоящих концертов. Если артист должен выступить хедлайнером на фестивале, вы можете просмотреть список других исполнителей как еще один источник информации об артистах.

(3) Откройте для себя еженедельно

Discover Weekly, родившийся на Spotify Hack Week в 2015 году, является одним из старейших и наиболее успешных плейлистов Spotify, созданных с помощью алгоритмов. Он сделан на заказ из 30 песен, которые вы никогда раньше не слушали, но которые, вероятно, вам понравятся.

Если бы я мог сохранить только один плейлист, возможно, это был бы этот. Почему? Во-первых, он обновляется каждый понедельник, а свежая новая музыка — отличный способ начать неделю. Но что еще более важно, он предназначен для того, чтобы разнообразить ваши модели прослушивания без ущерба для вашего музыкального вкуса, что является невероятно сложным балансом, который нужно найти самостоятельно.

Чтобы максимально использовать этот гениальный алгоритм, убедитесь, что вы сохраняете песни, которые вам нравятся, следите за любимыми исполнителями и пропускаете песни, которые вам не нравятся, в течение первых 30 секунд.

Забавный факт: однажды я снова встретился с другом из детского сада, найдя его песню в моем еженедельнике Discover Weekly. Да, алгоритм НАСТОЛЬКО хорош.

(4) ежедневных микса

Если вы хотите послушать музыку, которую вы уже знаете и любите, но с новой точки зрения, не ищите ничего, кроме ежедневных миксов. Вдохновленные вашей любимой музыкой, они представляют собой набор из шести предварительно смешанных списков воспроизведения, которые сочетают в себе ваши обычные прослушивания с новыми рекомендациями. Чем разнообразнее ваш музыкальный вкус, тем больше миксов вы получите.

Ежедневные миксы — идеальное дополнение к еженедельнику Discover Weekly. Они обновляются ежедневно, поэтому вам не нужно ждать понедельника, чтобы получить новые персональные рекомендации. Кроме того, они предназначены для того, чтобы познакомить вас с меньшим количеством и менее авантюрными находками по сравнению с теми, которые вы найдете в еженедельнике Discover Weekly.

Я даже не буду начинать со Spotify Wrapped, потому что думаю, что это заслуживает отдельного поста. А пока, удачной трансляции!