Некоторые из этих визуализаций были вдохновлены и вдохновлены работами других, особенно Бена Мэйхью. Он запускает Experimental 3–6–1 и создает визуализации для различных европейских лиг.
Визуализация высшей лиги
Посещаемость
Визуализации игроков A-лиги
Голы за 90
Сколько голов забили игроки за 90 минут игрового времени. В приведенном ниже примере известно, что Санталаб выходит на замену и имеет тенденцию забивать в последние 25–30 минут матчей.
Визуализации команд A-League
Выстрел доминирования
Защитная эффективность
Эффективность атаки
Хорошо против удачи
Разница мячей против разницы в ударах по воротам
Соотношение общего количества ударов защитника и атакующего
Таблица Visual Cann
Перестановки
Забил первым, не проиграл
Простое отслеживание того, сколько раз клубы забили первыми и выиграли или сыграли вничью. Итак, в примере ниже Western Sydney Wanderers имеет серию из 21 игры, в которой они забили первыми и не проиграли игру.
Проведенное время
Отслеживание процента игрового времени, проведенного клубом в определенных позициях: победа, поражение, ничья. В приведенном ниже примере «Сидней» провел 5,8% всего игрового времени в проигрышной позиции. Это соответствует примерно 5 минутам на 90 минут футбола.
ELO Вероятности
Часть расчета ELO - это предматчевая вероятность победы каждого клуба. Эта визуализация - это просто расчет и визуализация этого. См. Глоссарий для получения дополнительной информации об ELO.
Прогнозы раундов
Это прогнозируемые исходы матчей, которые выплевывает моя модель. Это не особо сложная модель, и поэтому она не особенно точна. Однако есть намерение улучшить его, что требует дополнительных затрат времени.
Рейтинг ELO
Относительно стандартные футбольные рейтинги ELO (см. Глоссарий) с изменениями за предыдущую неделю игр.
Глоссарий
Если я что-то пропустил, дайте мне знать, и я добавлю это. Отказ от ответственности: не все источники данных одинаковы, поскольку определения могут быть в некоторой степени субъективными, например, был ли выстрел в цель или он не должен соответствовать определенным критериям, однако категоризация в большинстве случаев по-прежнему выполняется человеком.
Выстрелил
Все выстрелы, в том числе в створ, блокированные, пропущенные и т. Д.
Выстрел в цель
Попытки по воротам, которые попали бы в сетку или если бы не вмешательство вратаря или защитника.
Выстрел от цели
Любая попытка бить по воротам, когда мяч проходит мимо ворот или попадает в каркас ворот.
ELO
Рейтинговая система Эло - это метод расчета относительных уровней навыков игроков в играх конкурент против конкурентов, таких как шахматы. - Википедия
Система рейтинга ELO была адаптирована для футбола с учетом размера победы, преимущества домашнего поля и важности матча.
Мой рейтинг был создан специально для высшей лиги с использованием его собственного значения K (индекс веса) и значения HFA (преимущество домашнего поля).
Коэффициент попадания в цель (SoTR)
Соотношение ударов в створ к общему количеству ударов в створ за и против, т. Е. SoT For / (SoT For + SoT Against)
Всего ударов
Общее количество бросков, сделанных за матч, т.е. Shots For + Shots Against
.
Общий коэффициент ударов (TSR)
Соотношение количества бросков к общему количеству бросков в игре, т.е. Shots For / (Shots For + Shots Against)
PDO
Scoring % + Save %
На 90
Статистику матчей сложно сравнивать напрямую, поскольку не все играют в футбол все 90 минут каждую неделю. Учет количества игрового времени позволяет более точно сравнить, какое влияние оказывает каждый игрок независимо от игрового времени.
В StatsBomb есть отличное объяснение Per 90.
Часто задаваемые вопросы
Откуда вы берете данные?
Первое правило сбора данных о футболе: нельзя говорить об очистке данных о футболе.
Данные на основе результатов обычно взяты из Ultimate A-League. Они любезно предоставили мне доступ к своим данным, и они соответственно помечаются. Если вы хотите поделиться со мной данными A-League, я буду более чем счастлив использовать их и доверяю вам как источнику.
Какое программное обеспечение вы используете?
У меня технический опыт работы со всеми видами данных, поэтому мой набор инструментов относится к более техническим аспектам.
- Для хранения данных Postgres
- Написание скриптов на Python
- Визуализации с использованием Tableau, однако я тестирую ggplot и некоторые другие подобные библиотеки с Python, чтобы включить гораздо больше автоматизации.
Как с вами связаться?
Самый простой способ - через @rovingrob в Твиттере.