Вступление

Музыка всегда была неотъемлемой частью жизни каждого. Мы слышим музыку, если не слушаем музыку, где бы мы ни находились, мелодичные звуки во время учебы, волнующие ощущения и ритмы, когда мы на вечеринках, и захватывающие и веселые караоке в машине, которые мы устраиваем с друзьями во время путешествий. Музыка повсюду вокруг нас.

Что, если бы мы могли анализировать музыку, которую мы слушаем, с помощью Data Science, чтобы получить представление о типах музыки, которую мы слушаем?

Мотивация

Мотивация этой серии - дать каждому возможность открыть для себя закономерности и идеи о себе и о музыке, которую они слушают. Поступая таким образом, вы лучше поймете их музыкальное поведение при прослушивании Spotify.

Note: The code to collect data and perform insights on your own music is linked below.

Для достижения этой цели мы будем стремиться показать полный цикл разработки проекта Data Science в количественном отношении и будем разбиты на следующие части.

1. Исследовательская аналитика данных (часть 1: визуализация данных)

Здесь мы изучим основы статистического анализа. Это дает нам представление о данных, с которыми мы работаем, и об имеющихся у нас функциях. Исследовательский анализ данных часто является наиболее важным этапом любого проекта в области науки о данных, поскольку он дает много возможностей для построения дальнейшей аналитики.

Мы надеемся ответить на следующие вопросы:

  • Какие музыкальные стили часто представлены на Spotify? Часто ли звучит более акустическая музыка?
  • Какую музыку мы можем любить?
  • Следуют ли самые популярные песни в чартах какой-то закономерности?

2. Исследовательская аналитика данных (часть 2: статистическое тестирование)

В этом разделе мы научимся придавать некоторую статистическую строгость нашим наблюдениям, которые мы сделали при визуализации данных. В конце концов, мы хотим количественно проверить наши гипотезы. Мы выполним некоторые статистические тесты, такие как критерий хи-квадрат, хорошее приспособление и Т-тест, а также изучение корреляции.

3. A / B-тестирование

Здесь мы рассмотрим, как проводить A / B-тестирование, отвечая на вопросы о наших музыкальных предпочтениях, например:

Мы надеемся ответить на следующие вопросы:

- Отличается ли стиль музыки, которую я слушаю, от тех, что играют в топ-100, и от тех, что представлены на Spotify?

  • Какие музыкальные стили, которые мы слушаем, могут быть более выраженными, чем типичная музыка, представленная на Spotify.
  • Наконец, мы общие? То есть слушаем ли мы музыку, которая следует той же схеме, что и самые популярные песни.

4. Машинное обучение (создание системы рекомендаций, предлагающих нам новые песни, которые мы могли бы заинтересовать)

В этой последней части будут использованы идеи, полученные нами как в ходе исследовательской аналитики данных, так и в ходе A / B-тестирования, при разработке алгоритма машинного обучения, который предлагает нам новые песни!

Исследовательская аналитика данных (визуализация)

Какие стили музыки часто представлены на Spotify? Часто ли звучит более акустическая музыка? Какую музыку мы можем любить? Следуют ли графики самых популярных песен какой-то закономерности?

Один из важнейших аспектов науки о данных - это способность концентрировать большие объемы данных в едином фрагменте информации. Это позволяет нам отвечать на вопросы, которые могут у нас возникнуть, и лучше понимать наше индивидуальное поведение и типы музыки, которые нам нравятся.

Какие стили музыки часто представлены на Spotify?

Важной частью Data Science является понимание распределения данных, которые мы собрали. Мы заботимся о распределении, поскольку оно дает нам представление о частотах различных стилей музыки, а также о форме частот, как если бы они были на Spotify. Давайте начнем с того, что рассмотрим распределения песен, представленных на Spotify!

Наблюдая за графиком распределения, мы сразу можем заметить следующее:

  • Характеристики речевость и акустичность имеют очень сильный наклон вниз, что можно отметить небольшое отклонение вверх в распределении ближе к концу графика. Это указывает нам на то, что музыкальные стили песен, представленных на Spotify, в целом менее акустические или речевые. Верхний хвост указывает нам, что песни с высокой речью или акустикой с большей вероятностью будут выбраны рядом с верхним -граница.

Или, если говорить более количественно, стили песен, оцененных как акустические или речевые более чем на 25%, с меньшей вероятностью будут представлены на Spotify.

  • Большинство песен, представленных на Spotify, часто не очень живые, и по мере увеличения живости песни вероятность того, что она будет размещена на Spotify, уменьшается.
  • Танцевальность, по-видимому, обычно распространяется, причем хвосты распределения имеют более низкую вероятность размещения на Spotify.
  • Атрибуты Валентность и Энергия кажутся примерно одинаковыми (равномерно распределенными). Отсутствие предпочтений для тех атрибутов, которые влияют на выбор музыки, представленной на Spotify.

В целом, песни, представленные на Spotify, имеют тенденцию демонстрировать низкую акустичность, речевость и живость с валентностью и энергией, не оказывая заметного влияния на песню, представленную на Spotify. Наконец, на Spotify чаще всего представлены песни с танцевальной способностью примерно 65%.

Какую музыку мы можем любить?

Тук-Тук, кто там? Что это за музыкальный стиль, Как хорошо! Что ж, давай узнаем!

Музыкальные вкусы могут быть прекрасным отражением наших эмоций и чувств. Они дают нам индивидуальность, чувство безопасности и, чаще всего, мелодичную мелодию, которая приливает и течет вместе с нашей повседневной жизнью.

Когда мы прекрасно себя чувствуем! Мы будем слушать музыку, в которой чувствуется, что мы на вершине мира! А когда у нас разбивается сердце, мы будем слушать песни, отражающие потерю любимого человека. Этот интроспективный взгляд на нашу жизнь действительно может быть заключен в музыку, которую мы слушаем!

Итак, давайте посмотрим, что мы сможем найти, просмотрев мои любимые песни на данный момент!

На приведенном выше графике мы можем наблюдать следующее:

  • Песни, которые я слушаю, вполне нормально распределены по акустике, валентности, танцевальности и энергии.
  • Мы могли бы отметить, что распределения живости и речевости должны быть сконцентрированы на нижней границе, предполагая, что музыка, которую я слушаю, не очень живая и речевая.

Мы можем заметить, что мне нравится музыка более акустическая, танцевальная и энергичная. С низким предпочтением живой или говорящей музыки.

Следуют ли графики самых популярных песен какой-то закономерности?

Боб, почему твоя музыка такая универсальная! Это потому, что они не имеют значения, это твой вкус. оттенок оттенок оттенок

Топ-50 песен, несомненно, являются самыми популярными в мире, независимо от того, слушаете ли вы их, когда покупаете новую сумку, или слушаете ее в фоновом режиме, когда разговариваете с друзьями в кафе. Это повсюду вокруг нас. Но мы, кажется, никогда не против послушать эти песни, в некоторых случаях они могут стать мягкими, поскольку наши уши привыкают к музыке. Но мы никогда не говорим: «Чувак, я терпеть не могу эту песню, у меня болят уши», почему это так?

Является ли это своего рода паттерном, принятым в 50 лучших песнях, который позволяет нам наслаждаться песней, играемой на заднем плане, и даже иногда подпевать ей?

Давайте разберемся!

Мы добьемся этого, построив коробчатую диаграмму для каждого стиля музыки, входящего в 100 лучших!

Наблюдая за диаграммой направленности, мы видим, что большинство песен, попавших в топ-100, это:

  • Очень танцевальный и энергичный. Но с низкой акустичностью, речью и живостью

Песни, попавшие в топ-100, демонстрируют большое предпочтение песням, которые очень танцевальны, и с низким уровнем речи. Например, Middle от Zed, Happier от Marshmello.

Заключение

Надеюсь, вам всем очень понравились идеи, полученные при визуализации 100 лучших песен в чартах, избранных песен и моих личных любимых песен на Spotify!

If you would like to try this for yourselves and have a look at your own Spotify tastes and try to do this yourselves, I've attached the link to the code I've used to collect this data here

Если вам действительно понравилась эта статья, сделайте 👏 и поделитесь ею с друзьями. Это даст мне знать, что вам, ребята, действительно понравился этот первый из серии, и я буду продолжать делать больше, если это так. Помните, вы можете хлопать в ладоши до 50 раз - для меня это очень важно.