Принятие более информированных, «лучших» решений

В части 1 мы провели предварительную обработку набора футбольных данных. В этой части мы проводим исследовательский анализ данных. Набор данных содержит 79 независимых переменных, которые включают широкий спектр атрибутов ставок. Гифка набора данных ниже.

Мы проанализируем «Ливерпуль», который был чемпионом Премьер-лиги 2019–2020 годов. Я сделаю некоторое агрегирование набора данных, чтобы представить его в итоговом формате. Вот некоторые из них;

  • Агрегация времени / агрегация временных интервалов
  • Дневная агрегация
  • Агрегация по месяцам
  • День недели / выходные и выходные дни

1- Часть графика

Я использую Plotly с Python. В приведенном выше коде показано, как можно строить линейные графики. Я буду сравнивать стратегию 2,5 меньше / больше для всех агрегатов.

2- Объединение времени / временного интервала

Первое объединение - это функции «Время / Временной интервал». Заметно, что производительность утром или вечером влияет на футбольный матч. На первом графике показано, какое время начала игры в 15:00 или 20:15 с большей вероятностью в 2,5 раза превышает окончательный результат. Я классифицирую время: утро, день и ночь. Второй сюжет дает больше информации о том, как время начала игры влияет на цель матча.

3-дневное агрегирование

Вторая агрегация - это атрибут «День». Из графика видно, что конец месяца, вероятно, будет на 2,5 выше запланированного. В целом, другие дни кажутся зеркально-симметричными.

Агрегирование за 5 месяцев

Третья агрегация - это столбец «Месяц». На рисунке показан линейный график, показывающий, что зимний семестр с большей вероятностью на 2,5 ниже итогового. В отличие от показателей для других типов ставок, в летних матчах больше голов.

Суммирование за 6 дней недели / выходных и выходных

Итоговая совокупность - это функции «День недели / выходные и выходные». Цифра первого дня недели показывает, что в среду и субботу более вероятно, что будет забито 2,5 гола. В другие дни картина почти такая же.

Резюме

В конце концов, мы провели предварительный анализ данных по набору футбольных данных, чтобы выявить закономерности и тенденции в конкретных функциях ставок. Весь код в моем аккаунте Github. Спасибо за чтение. Пожалуйста, дайте мне знать, если у вас есть какие-либо отзывы. Часть 1. Перейдите по ссылке ниже.



Г. Приложение

Ссылки G.1