На самом деле наука о данных — это гораздо более широкая тема, которая включает в себя стратегии обработки, хранения, составления отчетов, запросов и, наконец, отображения данных. Иногда считается, что это относится к группе аналитических процедур и результатов, которые они производят. Проще говоря, интеллектуальный анализ данных — это процесс поиска шаблонов и решения проблем с данными в базе данных.

Иногда термины «машинное обучение» и «интеллектуальный анализ данных» используются взаимозаменяемо, однако машинное обучение можно отличить, поскольку оно уделяет больше внимания созданию точных и прогнозирующих моделей, чем интеллектуальный анализ данных — поиску новых данных и идей в базах данных.

Процесс сбора данных можно разбить на четыре этапа:

Типичная структура машинного обучения, адаптированная для спортивной науки, представлена ​​ниже:

Некоторые примеры —

  • {Регрессия, нейронные сети} — идентификация талантов и прогнозирование результатов матча
  • {Дерево решений, случайный лес} — обнаружение движения и травмы
  • {K — Means, Hierarchical} — Анализ движения и техники игрока
  • Одно априорное правило — моделирование тренировок и анализ матчей
  • По классификации — Реабилитация
  • Согласно кластеризации — обнаружение событий
  • Марковский процесс принятия решений — определение гандикапов и оценка игроков

Общие методы классификации машинного обучения и примеры -

  • машины опорных векторов , которые использовались для различения различных движений, характерных для спорта, по данным инерционных единиц измерения или для выявления талантливых спортсменов по результатам фитнес-тестов;
  • деревья решений, используемые для моделирования заболеваемости и объяснения исхода матчей между победами и поражениями в командных видах спорта;
  • Случайный лес наблюдался в таких приложениях, как выбор команды и тактический анализ в футболе.

Распространенные методы кластеризации машинного обучения и примеры —

  • k - средства, используемые для разработки отличительных профилей команды на основе показателей эффективности или для определения различных моделей центра давления;
  • иерархическая кластеризация применяется для изучения взаимосвязи между мотивацией и результатами у спортсменов и выявления когнитивных структур техники спортсмена;
  • самоорганизующаяся карта, используемая для диагностики наличия утомления в моделях походки или визуализации изменений в стиле игры и коллективных движениях в командных видах спорта

Изучение общих правил связывания и примеры —

  • Априори используется для выявления шаблонов ограничений в тренировочной среде и предпочтительных моделей игры в командных видах спорта.
  • FURIA используется для измерения сходства в наборах биомедицинских данных и
    в качестве основы для мониторинга прогресса реабилитации после травмы колена.
  • Рост FP используется для выявления злоупотребления гормоном роста и мониторинга питания у спортсменов.

Оценка модели

Машинное обучение позволяет использовать ряд методов оценки производительности моделей, каждый из которых имеет свои преимущества и недостатки. Абсолютные показатели, такие как среднеквадратическая ошибка или средняя абсолютная ошибка, распространены в моделировании отношений, в то время как относительные показатели, такие как коэффициент детерминации, часто известный как R-квадрат, направлены на определение дисперсии выходной переменной, которая объясняется переменные-предикторы. Качество соответствия модели также можно определить с помощью измерений информационных критериев, что делает их полезными для выбора модели.
Матрица путаницы — это инструмент, который часто используется при категоризации. Это предлагает тщательную оценку эффективности матрицы в различных контекстах.

Переоснащение и недообучение

С точки зрения спортивной науки идентификация талантов является примером переобучения, когда модель строится для прогнозирования результатов спортсмена в будущем с использованием исторических данных, полученных от успешных спортсменов в прошлом. Одно значение или линейная функция могут быть использованы в решении для недостаточной подготовки, чтобы классифицировать этих «успешных» или «неуспешных» спортсменов. Например, он может указать, что спортсмен должен соответствовать минимальным требованиям по росту или массе тела, чтобы преуспеть в конкретном виде спорта. Например, он может указать, что спортсмен должен соответствовать минимальным требованиям по росту или массе тела, чтобы преуспеть в конкретном виде спорта.

Сценарий, в котором обязательны многочисленные предварительные условия, такие как прохождение определенных контрольных показателей по физическим или техническим экзаменам, может представлять собой чрезмерное решение той же проблемы и может очень хорошо отображать конкретную группу населения или вид спорта, но не распространяться на новые когорты. К счастью, многие подходы к машинному обучению имеют встроенные функции для уменьшения или предотвращения переобучения, такие как параметры сложности и процедуры обрезки.

СБОР ДАННЫХ В СПОРТИВНЫХ НАУКАХ

Одной из причин более широкого применения таких методов в спортивной науке является их способность использоваться в самых разных областях. Это привело к тому, что использование машинного обучения распространилось на такие разные области, как:

  • тренировочная нагрузка,
  • модели развития талантов,
  • автоматическое распознавание движений игрока в зависимости от вида спорта и
  • масштабирование требований соответствия на основе антропометрических и половых различий,

На поле данные отслеживания игроков в сочетании с данными о событиях матча использовались для понимания сетей передач, определения и визуализации давления, моделирования внутрикомандных относительных фазовых связей, а также вероятностных моделей движения и зон контроля.

В арсенал современных спортивных ученых должен входить интеллектуальный анализ данных. Спортивному ученому теперь нужны как минимум глубокие знания в области интеллектуального анализа данных, машинного обучения и систем поддержки принятия решений, чтобы продвигаться в направлении исследований и преуспевать в прикладных ситуациях.

В этом блоге изложены основы интеллектуального анализа данных и машинного обучения, а также приведены примеры того, как эти области могут напрямую помочь людям и организациям, работающим в спортивных ситуациях. При правильном использовании интеллектуальный анализ данных и машинное обучение способны глубоко изменить то, как люди, работающие в спортивной индустрии, концептуализируют, воплощают новые идеи в жизнь и оценивают их.

Это в дополнение к повышению точности и эффективности принятия решений.

pip install sports_science: машинное обучение в науке о спорте — во второй части будут блоки кода для каждого примера, так что следите за новостями.

Счастливого обучения…!!