Наш подход Moneyball к Fantasy EPL (team_id: 2057677)

Если вы впервые попадаете на один из моих блогов Fantasy EPL, вы можете сначала проверить Часть 1, Часть 2, Часть 3, Часть 4 и Часть 5, чтобы сначала ознакомиться с нашим общим подходом и улучшения, которые мы внесли с течением времени. Моим соучастником в этом проекте был Эндрю Спроул, который, как и я, очень увлечен наукой о данных, машинным обучением / искусственным интеллектом и Fantasy EPL.

Что нового на этой неделе?

Мы рады сообщить, что на этой неделе мы добавили три новые функции:

  1. Подберите оптимальную смешанную команду игроков АПЛ
  2. Скорректированный FDR (рейтинг сложности приспособлений)
  3. Более точные данные о травмах

Ниже приводится краткое описание каждой новой функции и визуализации некоторых идей и выводов, полученных с помощью нашего нового алгоритма.

Подберите оптимальную смешанную команду игроков АПЛ

Мы написали веб-скребок с использованием Selenium, который сканирует команды из 100 лучших игроков мира и возвращает составы команд, которые они выбирают каждую неделю, и выбранную их полную команду игроков. Долгосрочная идея состоит в том, чтобы отслеживать их выбор каждую неделю и выяснять, кто из 100 лучших игроков к восьмой неделе также попадет в топ-100 в конце сезона. Это поможет нам выделить действительно последовательных пользователей Fantasy и позволит нам провести более полный анализ их еженедельных выборов, что помогло им поддерживать высокие показатели в течение всего сезона.

Ниже вы можете увидеть наиболее популярных игроков для каждой позиции на данный момент пользователями Top100 Fantasy:

Самые популярные вратари

Самые избранные защитники

Самые популярные полузащитники

Самые популярные нападающие

Мы использовали эти данные и текущие цены на игроков, чтобы создать команду ниже, которая представляет собой смесь наиболее отобранных игроков по Top100:

Формирование команды, наиболее популярное среди 100 лучших пользователей Fantasy

Ниже вы можете увидеть расстановки, выбранные лучшими игроками на прошлой неделе. Похоже, что большинство лучших игроков выбирают 3–4–3 расстановки, вероятно, пытаясь оптимизировать общее количество очков, полученных от своих атакующих игроков, которые обычно имеют более высокие шансы получить голевые передачи, голы и бонусные очки. общий.

Скорректированный FDR (рейтинг сложности приспособлений)

Наша вторая новая функция была вдохновлена ​​тем фактом, что теперь у нас есть достаточно данных за последние восемь игровых недель, чтобы начать корректировку исходных рейтингов силы команды, которые команда EPL Fantasy Data предлагала в начале сезона на основе собственных расчетов на основе исторических результатов команд. . Вот как выглядит исходный индекс силы команды:

Как видите, это выглядит слишком жестко и без достаточных нюансов в большинстве средних оценок. Наша цель состояла в том, чтобы построить наш собственный индекс силы команды на основе результатов команды в текущем сезоне, а затем совместить его с исходным индексом FDR, приведенным выше, что даст нам окончательный динамически скорректированный показатель силы команды, который со временем будет меняться в зависимости от того, как команда работает. еженедельно в течение сезона.

Team_Strength_Index = (общее количество очков + забитые голы + полученные голы)

Для нормализации данных мы использовали процентили для каждого показателя, чтобы распределение данных оставалось в стандартизованном диапазоне от 0 до 100. Например, у Ливерпуля сейчас 24 очка и они находятся в 100-м процентиле этого показателя, у них также лучшая защита с GA = 6 и 2-е лучшее нападение с GF = 14, и они находятся на 100-м и 95-м местах. процентиль соответственно. Итак, их общая результативность / показатель силы в текущем сезоне = 100+ 100 + 95 = 295. Вы можете увидеть результаты всех остальных команд ниже:

Эта динамическая оценка позволяет нам находить больше выбросов с обеих сторон и отличать действительно хорошие команды от действительно плохих. Как вы можете видеть, Уотфорд, Норвич, Эвертон, Саутгемптон и Ньюкасл работают довольно плохо по сравнению с остальной группой. «Манчестер Юнайтед», «Вулвз» и «Борнмут» имеют средний результат, равный 152, и только пять команд находятся выше 75-го процентиля: Ливерпуль, Манчестер Сити, Арсенал, Лестер и Бернли с «Челси» и Кристалл. Дворец внимательно следит.

Следующее, что мы сделали, это применили скейлер MinMax и возьмем z-значения этого распределения выше и возведем их в квадрат, чтобы получить аналогичное распределение данных, но в масштабе, который позволит нам смешать его с исходными оценками FDR:

Окончательный смешанный балл представляет собой среднее значение z-показателей нашей динамической силы команды и исходных жестких оценок FDR (см. Новый рейтинг команд ниже):

Как видите, это выглядит намного более справедливым, чем исходная таблица FDR, в которой команды помещены в жесткие корзины с округленными целыми числами в диапазоне от 2 до 5, не допуская каких-либо промежуточных нюансов. В дальнейшем мы будем использовать это распределение adjust_FDR, чтобы информировать наш выбор алгоритма. При этом давайте посмотрим, как выглядят данные FDR на этой неделе:

Как видите, Вилла, Кристал Пэлас, Саутгемптон, Манчестер Юнайтед и Уотфорд, похоже, будут иметь более сложные функции в следующих трех играх, поэтому наш алгоритм не будет выбирать игроков из этих команд. У Челси, Борнмута, Вест Хэма, Ман Сити, Арсенала и Лестера относительно простые графики, поэтому выбор игроков из этих команд может быть хорошей инвестицией.

Более точные данные о травмах

Последняя новая функция, которую мы добавили на этой неделе, заключалась в том, чтобы очистить веб-сайт, который обновляет новости о травмах EPL намного чаще и точнее, чем веб-сайт Fantasy, поэтому мы можем включить это в наш алгоритм и избежать подбора травмированных игроков, которые не были обновлены на Сайт фэнтези. Мы получаем данные о травмах со следующего веб-сайта:



На этом мы завершаем наш раздел обновлений функций и возобновляем основной формат блога Fantasy EPL, который мы публикуем каждую неделю ниже.

Итоги работы команды GW8 и общая статистика

Что ж ... GW8 был трудным, и я уверен, что это относится и к большинству наших читателей :) Большинство крупных команд и дорогих игроков разочарованы, что привело к общему баллу AVG для всех пользователей Fantasy в 38 баллов на команду фантазии, что чрезвычайно мало . На самом деле у нас получилось лучше, чем у AVG с 44 баллами, поэтому мы не слишком расстроены, но чувствуем, что время для подстановочного знака не сработало, и снова мы не выбрал хорошего капитана, хотя все могло бы быть немного лучше, если бы Ауба забил тот шанс на 95-й минуте.

Общая статистика GW8 для информирования наших выборов GW9

Давайте посмотрим на лучших игроков по рентабельности инвестиций и статистике за pts_per_90min:

10 лучших вратарей по рентабельности инвестиций

10 лучших вратарей по pts_per_90min

Десятка лучших защитников по рентабельности инвестиций

10 лучших защитников по pts_per_90min

10 лучших полузащитников по рентабельности инвестиций

10 лучших полузащитников по pts_per_90min

Топ-10 Strikers по рентабельности инвестиций

10 лучших нападающих по pts_per_90min

Алгоритмический выбор GW9

Напоминаем, что наш алгоритм учитывает скорректированный бюджет на формирование команды и пытается максимизировать затраты на позицию для 11 основных игроков, а затем дает вам замену с хорошим показателем рентабельности инвестиций. Большую часть недель мы играли по схеме 3–4–3, и теперь, когда мы знаем, что большинство игроков Top100 в мире выбирают одну и ту же схему, мы были бы еще более склонны продолжать использовать ее. вперед. Основываясь на текущих показателях рентабельности инвестиций, отфильтровывая любую команду со средним уровнем сложности соперника (FDR ≥ 3,21) в течение следующих трех игр и удаляя травмированных игроков из списка доступных выборов, наш алгоритм выбрал команду ниже как оптимальную на данный момент для расходования всего бюджета в 100 миллионов долларов. :

Как видите, остается даже бюджет 0,7, с которым можно поиграть и попробовать разные варианты для некоторых ключевых позиций. Поскольку в прошлый раз мы использовали подстановочный знак, мы не смогли выбрать полную конфигурацию, указанную выше. Вместо этого мы сделали два переноса:

Pukki - OUT - Vardy - IN

Sterling - OUT - KDB - IN

Наши субмарины были продиктованы нашим желанием заполучить Варди, учитывая относительно легкий график Лестера, и для этого нам пришлось продать Стерлинг, что нормально, потому что мы думаем, что он немного завышен, а KDB - будет гораздо лучше, чем он, если он вернется после травмы и будет играть последовательно, о чем говорят последние новости о травмах. Кроме того, Стерлинг дважды играл за Англию в течение недели, поэтому он, скорее всего, не получит полных 90 минут за «Сити» в эти выходные.

Что касается капитана, мы колебались между Тэмми Абрахамом и Варди, но предпочли пойти с Тэмми, учитывая, что Ньюкасл пока находится в списке худших 5 защит, а Бернли - в списке 5 лучших защит, так что мы ожидаем, что Челси забьет. больше голов, чем в Лестере. Мы нервничаем из-за травм Хитона и Кресвелла и из-за того, что Мейтленд-Найлз не играет, но посмотрим ...

Статистика команды

Рассмотрение лучшей / худшей защиты и нападения можно использовать по-разному - например, если лучшая нападающая команда играет с худшей командой защиты, вы можете захотеть капитаном атакующего мидера или нападающего. Кроме того, вы можете предпочесть DF и GK из лучших защитных команд, глядя на алгоритмические рекомендации для этих позиций.

7 лучших защит

7 худших защит

7 лучших нарушений

7 худших нарушений

Совокупная статистика рентабельности инвестиций команды

Ниже вы можете увидеть команды, отсортированные по совокупной рентабельности инвестиций игроков. Обратите внимание, что активный игрок - это любой игрок, сыгравший не менее 25% от общего возможного игрового времени. Например, общее количество возможных минут = num_weeks * 90 минут = 8 * 90 = 720. Таким образом, мы считаем, что любой игрок, сыгравший в сумме не менее 720/4 = 180 минут, является активным на этом. команда.

Статистика теперь начинает довольно хорошо сходиться, и мы можем начать замечать некоторые полезные идеи. Например, из-за более высокой ротации игроков в «Манчестер Сити» их статистика avg_player_roi значительно упала, потому что до сих пор они меняли как минимум 16 активных игроков во время своих игр, по сравнению с 13–14 у большинства других команд. активные игроки. "Челси", "Шпоры", "Манчестер Юнайтед", "Эвертон" и "Борнмут" по-прежнему отстают в целом из-за более высокой ротации игроков и большого количества игроков с завышенными ценами.

В верхней части статистики avg_pts_per_player и avg_player_ROI мы можем найти Бернли, Лестер, Вест Хэм, Вулвз, Шеффилд Юнайтед и Астон Вилла как команды, которые используют более плотное ядро ​​активных 13–14 игроков. , которые также демонстрируют завышенные показатели и занижают цены, что делает покупку игроков этих команд хорошей долгосрочной инвестицией. Конечно, Ливерпуль и Манчестер Сити находятся в первых двух местах, но большинство их игроков довольно дорогие, поэтому нужно покупать игроков из этих двух команд с умом и рассчитывать на долгосрочную выгоду.

Последние мысли:

Следующая интересная функция, которую мы планируем, - это включение коэффициентов от игроков, делающих ставки на спорт в предстоящих играх, поскольку у большинства крупных букмекерских контор есть команды специалистов по анализу данных и аналитиков, которые используют большой объем данных для оценки оптимальных коэффициентов. , поэтому мы решили, что можем совмещать их работу и использовать коэффициенты, чтобы как-то информировать наш выбор алгоритма или, по крайней мере, еще больше скорректировать наши оценки FDR.

Как всегда - спасибо за чтение и удачи в эти выходные!