Некоторые из этих визуализаций были вдохновлены и вдохновлены работами других, особенно Бена Мэйхью. Он запускает Experimental 3–6–1 и создает визуализации для различных европейских лиг.

Визуализация высшей лиги

Посещаемость

Визуализации игроков A-лиги

Голы за 90

Сколько голов забили игроки за 90 минут игрового времени. В приведенном ниже примере известно, что Санталаб выходит на замену и имеет тенденцию забивать в последние 25–30 минут матчей.

Визуализации команд A-League

Выстрел доминирования

Защитная эффективность

Эффективность атаки

Хорошо против удачи

Разница мячей против разницы в ударах по воротам

Соотношение общего количества ударов защитника и атакующего

Таблица Visual Cann

Перестановки

Забил первым, не проиграл

Простое отслеживание того, сколько раз клубы забили первыми и выиграли или сыграли вничью. Итак, в примере ниже Western Sydney Wanderers имеет серию из 21 игры, в которой они забили первыми и не проиграли игру.

Проведенное время

Отслеживание процента игрового времени, проведенного клубом в определенных позициях: победа, поражение, ничья. В приведенном ниже примере «Сидней» провел 5,8% всего игрового времени в проигрышной позиции. Это соответствует примерно 5 минутам на 90 минут футбола.

ELO Вероятности

Часть расчета ELO - это предматчевая вероятность победы каждого клуба. Эта визуализация - это просто расчет и визуализация этого. См. Глоссарий для получения дополнительной информации об ELO.

Прогнозы раундов

Это прогнозируемые исходы матчей, которые выплевывает моя модель. Это не особо сложная модель, и поэтому она не особенно точна. Однако есть намерение улучшить его, что требует дополнительных затрат времени.

Рейтинг ELO

Относительно стандартные футбольные рейтинги ELO (см. Глоссарий) с изменениями за предыдущую неделю игр.

Глоссарий

Если я что-то пропустил, дайте мне знать, и я добавлю это. Отказ от ответственности: не все источники данных одинаковы, поскольку определения могут быть в некоторой степени субъективными, например, был ли выстрел в цель или он не должен соответствовать определенным критериям, однако категоризация в большинстве случаев по-прежнему выполняется человеком.

Выстрелил

Все выстрелы, в том числе в створ, блокированные, пропущенные и т. Д.

Выстрел в цель

Попытки по воротам, которые попали бы в сетку или если бы не вмешательство вратаря или защитника.

Выстрел от цели

Любая попытка бить по воротам, когда мяч проходит мимо ворот или попадает в каркас ворот.

ELO

Рейтинговая система Эло - это метод расчета относительных уровней навыков игроков в играх конкурент против конкурентов, таких как шахматы. - Википедия

Система рейтинга ELO была адаптирована для футбола с учетом размера победы, преимущества домашнего поля и важности матча.

Мой рейтинг был создан специально для высшей лиги с использованием его собственного значения K (индекс веса) и значения HFA (преимущество домашнего поля).

Коэффициент попадания в цель (SoTR)

Соотношение ударов в створ к общему количеству ударов в створ за и против, т. Е. SoT For / (SoT For + SoT Against)

Всего ударов

Общее количество бросков, сделанных за матч, т.е. Shots For + Shots Against.

Общий коэффициент ударов (TSR)

Соотношение количества бросков к общему количеству бросков в игре, т.е. Shots For / (Shots For + Shots Against)

PDO

Scoring % + Save %

На 90

Статистику матчей сложно сравнивать напрямую, поскольку не все играют в футбол все 90 минут каждую неделю. Учет количества игрового времени позволяет более точно сравнить, какое влияние оказывает каждый игрок независимо от игрового времени.

В StatsBomb есть отличное объяснение Per 90.

Часто задаваемые вопросы

Откуда вы берете данные?

Первое правило сбора данных о футболе: нельзя говорить об очистке данных о футболе.

Данные на основе результатов обычно взяты из Ultimate A-League. Они любезно предоставили мне доступ к своим данным, и они соответственно помечаются. Если вы хотите поделиться со мной данными A-League, я буду более чем счастлив использовать их и доверяю вам как источнику.

Какое программное обеспечение вы используете?

У меня технический опыт работы со всеми видами данных, поэтому мой набор инструментов относится к более техническим аспектам.

  • Для хранения данных Postgres
  • Написание скриптов на Python
  • Визуализации с использованием Tableau, однако я тестирую ggplot и некоторые другие подобные библиотеки с Python, чтобы включить гораздо больше автоматизации.

Как с вами связаться?

Самый простой способ - через @rovingrob в Твиттере.

Кто еще делает крутые штуки с футбольными данными?