Вы можете получить эти модели прямо в свой почтовый ящик, подписавшись на нашу бесплатную рассылку здесь.

В нашей модели прогнозирования игры ключевым компонентом является оборонительная сила каждой команды. В настоящее время мы используем целостный подход, который изучает единое значение силы каждой команды, а также включает сильные стороны защиты для конкретных игроков. В этой серии статей, состоящей из бесконечных частей, мы предпримем пошаговые шаги, чтобы включить в нашу модель различные аспекты защиты. Здесь мы начнем с рассмотрения того, насколько сильна каждая команда в предотвращении ассистентов.

На высоком уровне наша модель рассматривает каждую игру в сезоне и оценивает силу каждой команды в обеспечении передач и силу каждой команды в предотвращении передач.

Глядя на все 30 команд, вот сколько передач каждая из них может предотвратить за игру (относительно среднего показателя по лиге).

Как обычно, мы отслеживаем неопределенность в модели. Столбики погрешностей дают представление о том, насколько точна модель.

Один из способов подумать об этом графике — посмотреть на такую ​​команду, как «Бостон», которая набрала 2 очка. Если бы «Бостон» играл с командой, которая обычно делает 10 передач, «Бостон», вероятно, ограничил бы их до 8 передач.

Глядя на планки погрешностей, легко разделить команды на 4 уровня:

  1. Высший уровень: «Голден Стэйт», «Финикс» и «Бостон» предотвращают более 1 передачи за игру.
  2. Хороший уровень: все команды между «Клипперс» и «Кливлендом» лучше среднего по лиге предотвращают передачи.
  3. Средний уровень: от Миннесоты до Сан-Антонио, эти команды не препятствуют передачам, но и не отказываются от многих дополнительных передач.
  4. Нижний уровень: «Шарлотта» и «Лейкерс» отказываются от многих передач.

В качестве побочного продукта модели нам также нужно было оценить, насколько хорошо каждая команда генерирует дополнительные передачи (относительно среднего показателя по лиге). Эти результаты показаны на графике ниже.

Следует отметить одну вещь: разница между лучшими и худшими командами намного больше, если сравнивать нападение и защиту. Команда лучших нападающих может генерировать дополнительные 3,5 передачи за игру, в то время как лучшая команда защиты может предотвратить только 2 передачи за игру. Это согласуется с общей идеей о том, что в командных атаках больше различий, чем в защите, что достаточно задокументировано.

Эти графики выше могут быть легко неверно истолкованы. В качестве примера возьмем три команды: «Орландо Мэджик», «Финикс Санз» и «Бостон Селтикс». Возвращаясь к первому графику о том, насколько хорошо каждая команда предотвращает передачи, можно сказать, что «Бостон» — лучшая оборонительная команда. Но это не будет правильным выводом. Если вы посмотрите на неопределенность модели, модель в основном дает 50–50 шансов на то, что Феникс лучше, чем Бостон. Напротив, обе эти команды лучше, чем команда среднего уровня, такая как Мэджик.

В нападении это отдельная история. Феникс — явный победитель по дополнительным передачам, в то время как модель не может отличить Бостон от Орландо.

Преимущество домашнего суда?

Еще один побочный продукт, наша модель также оценивает, сколько стоит преимущество домашней площадки, когда речь идет об ассистах. Невероятно,преимущество домашней площадки дает вам почти одну дополнительную передачу. И модель достаточно уверена в этом: домашняя команда генерирует дополнительные 0,5–1,25 передачи за счет преимущества домашней площадки.

Заглядывая вперед

Последние две недели я отдыхал от возни со своими моделями. Я пытался увеличить свой пробег, что буквально отнимало все мое свободное время (и часть моего несвободного времени). Чтобы предотвратить травму, я собираюсь вернуться на следующие несколько недель. Итак, теперь у меня есть завершенная инженерия, чтобы посмотреть на различные защитные модели, подобные той, что в этом посте. Я, вероятно, немного изучу их, если только я не буду отвлекаться на другие идеи, которые у меня есть.

Стэн Модель

Вы можете перестать читать. Этот раздел предназначен только для тех, кто интересуется лежащей в основе вероятностной моделью. Либо потому, что они хотят понять детали, либо они хотят расширить это сами. Модель представляет собой иерархическую модель помощи команде.

data {
    //----------------------------------------//
    // Historical game data                   //
    //----------------------------------------//
    int<lower=0> n_games;
    int<lower=0> n_teams;
    int<lower=0>away_teams[n_games];
    int<lower=0>home_teams[n_games];
    real<lower=0>away_score[n_games];
    real<lower=0>home_score[n_games];
}
parameters {
    //----------------------------------------//
    // Team performance parameters            //
    //----------------------------------------//
    real home_advantage;
    real <lower=0> sigma;
    real<lower=0> alpha;
    vector[n_teams] team_offense;
    real<lower=0> team_offense_sigma_bar;
    vector[n_teams] team_defense; 
    real<lower=0> team_defense_sigma_bar;
}

model {
    //----------------------------------------//
    // Priors                                 //
    //----------------------------------------//    
    team_offense_sigma_bar ~ cauchy(0, 5);
    team_offense ~ normal(0, team_offense_sigma_bar);
    team_defense_sigma_bar ~ cauchy(0, 5);
    team_defense ~ normal(0, team_defense_sigma_bar);
    sigma ~ cauchy(0, 5);
    home_advantage ~ normal(0, 5);
    //----------------------------------------//
    // Model                                  //
    //----------------------------------------//      
    for(game in 1:n_games) {
        home_score[game] ~ normal(alpha + 
                                  home_advantage + 
                                  team_offense[home_teams[game]] -
                                  team_defense[away_teams[game]], 
                                  sigma);
        away_score[game] ~ normal(alpha + 
                                  team_offense[away_teams[game]] - 
                                  team_defense[home_teams[game]], 
                                   sigma);
    }
    
}