В конце прошлой недели мы все думали об одном: «Премьер-лига возвращается». С того момента, как кто-то начал следить за игрой, «MatchDay Live» всегда был чем-то, чего можно было бы ожидать. Вам никогда не был нужен план на выходные. И мы не были исключением. Увлекается игрой и ее драмами. Но у нас были и другие интересы. Конечно, это связано с игрой, а именно с скрытой за ней наукой. Цифры и закономерности заинтриговали нас не меньше, чем цели и решения. И здесь на помощь приходит FPL. Он не только дает нам возможность надеть обувь менеджера, но и дает нам ценные данные, данные для экспериментов и данные, позволяющие попытаться заглянуть в будущее.

Итак, мы начали с целью предсказать команду мечты на предстоящей неделе на основе исторических показателей игроков. Нам нужна была команда, которая покажет наилучшие результаты в предстоящую неделю с прицелом на будущие Gameweeks. Мы начали нашу работу в GW 23 и продолжали до сих пор, постоянно дорабатывая модель в зависимости от ее производительности и ожидаемых результатов. Мы уже рассказали о процессе разработки функций и о выводах, которые мы извлекли из данных в нашем предыдущем блоге.

Https://medium.com/@prashanthsekar1/fpl-analysis-cf5307abcbb0

FPL предоставляет обычные данные об игроках, такие как забитые голы, передачи, выполненные передачи, попытки, отборы, перехваты, выносы, сейвы, пропущенные голы… Уф, с каждым игроком связано 53 индивидуальных функции. И эти данные предоставляются для каждой Gameweek. Помимо этого, есть статистика на уровне команды, такая как общая сила команды, сила дома, на выезде, сила атаки, сила защиты… Видите ли, я сказал, что FPL - это круто. Мы думали, что для того, чтобы зафиксировать лучшую производительность за неделю, нам нужно добавить еще несколько функций в этот набор. Когда мы занялись этой проблемой, мы поняли, что упускаем одну важную особенность, которая беспокоит каждого спортсмена и его / ее соратника, - «ФОРМЫ». Все функции FPL принадлежали предыдущему Gameweek. Поэтому нам пришлось рассчитать собственную метрику формы. Мы сделали самое простое из возможных. Мы рассчитали среднее значение каждого показателя за последние 4 недели и включили его в качестве функции для текущей Gameweek. Таким образом, прогноз для GW 28 будет учитывать характеристики GW 24, 25, 26 и 27. Почему мы это сделали? Потому что мы думали, что нам нужна не самая последняя звезда, а самая последняя, ​​постоянно сияющая звезда. Мы также приняли во внимание то, против кого играют игроки, то есть форму лучшего игрока на дополнительной позиции в оппозиции. Итак, что касается Бена Дэвиса, мы могли бы смотреть на форму Садио Мане (если его «шпоры» против «Ливерпуля»), потому что мы все видели, как сильно Дэвис получил скин. Мы также подумали, что было бы неплохо отменить эффект карты. Кто-то мог провести отличную игру, но получил бы карточку (желтую) за дерзкое поведение. Мы не хотели, чтобы это повлияло на наши результаты при прогнозировании следующей игры. Также мы попытались предсказать команду мечты, которая продержится не только на текущей неделе, но и в ближайшем обозримом будущем. Таким образом, уровень сложности следующих раундов учитывается до того, как игрок будет назван в нашей команде.

Итак, есть множество функций, которые дает FPL, и есть множество, которые мы представили. Это сделало бы много переменных и, скорее всего, могло бы иметь избыточные. Поэтому нам пришлось запустить функцию STEP, которая будет определять переменные с наибольшей корреляцией с конечным результатом и, следовательно, с наибольшим влиянием на него. Наконец, мы запустили простой алгоритм линейной регрессии, чтобы спрогнозировать очки на предстоящую неделю для каждого игрока. Мы использовали среднюю абсолютную ошибку в качестве метрики оценки для нашей модели, которая в основном находит среднее значение абсолютной ошибки между очками команды мечты FPL и прогнозируемыми нашей моделью очками команды мечты. А наш MAE составил около 2,5 балла. Таким образом, хотя мы не можем дословно предсказать команду мечты FPL, наша команда приближается к команде мечты на 2,5 очка.

В качестве доказательства концепции мы прилагаем несколько скриншотов нашего прогноза для Gameweek 29 ниже.

Цель на приведенных выше снимках экрана представляет собой фактические очки, полученные игроком в GW29, в то время как pred отмечает наше прогнозируемое значение. Pred1 и Pred2 - это значения, предсказанные для следующих двух игровых недель, GW30 и GW31. Хотя мы можем и не предсказать фактическое количество баллов, как оно есть (давай немного расслабимся: P), общая разница в баллах в конечном итоге снизится до 2,5.

Команда нашей мечты на прошедшей Gameweek (GW32) набрала 90 очков.

Наши 11 следующие: Хитон; Эванс, Кин, Уорд, Дэвис; Хазард, Алли, Эриксен; Агуэро, Лукаку, Коста.

Идея представляет собой попытку объединить два наших главных интереса, футбол и машинное обучение, и посмотреть, чем мы можем закончить. Может быть много очевидных вещей, которые мы могли пропустить, или идей, которые могут показаться неверными. Мы хотели бы получить отзывы и обсуждение этой темы от читателей. Потому что мы знаем, что вы должны понять проблему, чтобы начать ее решать, и кто еще, кроме обычной аудитории, знает проблему лучше.

Работа Venkatesh WS и T S Prashanth