Принятие более информированных, «лучших» решений
В части 1 мы провели предварительную обработку набора футбольных данных. В этой части мы проводим исследовательский анализ данных. Набор данных содержит 79 независимых переменных, которые включают широкий спектр атрибутов ставок. Гифка набора данных ниже.
Мы проанализируем «Ливерпуль», который был чемпионом Премьер-лиги 2019–2020 годов. Я сделаю некоторое агрегирование набора данных, чтобы представить его в итоговом формате. Вот некоторые из них;
- Агрегация времени / агрегация временных интервалов
- Дневная агрегация
- Агрегация по месяцам
- День недели / выходные и выходные дни
1- Часть графика
Я использую Plotly с Python. В приведенном выше коде показано, как можно строить линейные графики. Я буду сравнивать стратегию 2,5 меньше / больше для всех агрегатов.
2- Объединение времени / временного интервала
Первое объединение - это функции «Время / Временной интервал». Заметно, что производительность утром или вечером влияет на футбольный матч. На первом графике показано, какое время начала игры в 15:00 или 20:15 с большей вероятностью в 2,5 раза превышает окончательный результат. Я классифицирую время: утро, день и ночь. Второй сюжет дает больше информации о том, как время начала игры влияет на цель матча.
3-дневное агрегирование
Вторая агрегация - это атрибут «День». Из графика видно, что конец месяца, вероятно, будет на 2,5 выше запланированного. В целом, другие дни кажутся зеркально-симметричными.
Агрегирование за 5 месяцев
Третья агрегация - это столбец «Месяц». На рисунке показан линейный график, показывающий, что зимний семестр с большей вероятностью на 2,5 ниже итогового. В отличие от показателей для других типов ставок, в летних матчах больше голов.
Суммирование за 6 дней недели / выходных и выходных
Итоговая совокупность - это функции «День недели / выходные и выходные». Цифра первого дня недели показывает, что в среду и субботу более вероятно, что будет забито 2,5 гола. В другие дни картина почти такая же.
Резюме
В конце концов, мы провели предварительный анализ данных по набору футбольных данных, чтобы выявить закономерности и тенденции в конкретных функциях ставок. Весь код в моем аккаунте Github. Спасибо за чтение. Пожалуйста, дайте мне знать, если у вас есть какие-либо отзывы. Часть 1. Перейдите по ссылке ниже.
Г. Приложение
Ссылки G.1