На самом деле наука о данных — это гораздо более широкая тема, которая включает в себя стратегии обработки, хранения, составления отчетов, запросов и, наконец, отображения данных. Иногда считается, что это относится к группе аналитических процедур и результатов, которые они производят. Проще говоря, интеллектуальный анализ данных — это процесс поиска шаблонов и решения проблем с данными в базе данных.
Иногда термины «машинное обучение» и «интеллектуальный анализ данных» используются взаимозаменяемо, однако машинное обучение можно отличить, поскольку оно уделяет больше внимания созданию точных и прогнозирующих моделей, чем интеллектуальный анализ данных — поиску новых данных и идей в базах данных.
Процесс сбора данных можно разбить на четыре этапа:
Типичная структура машинного обучения, адаптированная для спортивной науки, представлена ниже:
Некоторые примеры —
- {Регрессия, нейронные сети} — идентификация талантов и прогнозирование результатов матча
- {Дерево решений, случайный лес} — обнаружение движения и травмы
- {K — Means, Hierarchical} — Анализ движения и техники игрока
- Одно априорное правило — моделирование тренировок и анализ матчей
- По классификации — Реабилитация
- Согласно кластеризации — обнаружение событий
- Марковский процесс принятия решений — определение гандикапов и оценка игроков
Общие методы классификации машинного обучения и примеры -
- машины опорных векторов , которые использовались для различения различных движений, характерных для спорта, по данным инерционных единиц измерения или для выявления талантливых спортсменов по результатам фитнес-тестов;
- деревья решений, используемые для моделирования заболеваемости и объяснения исхода матчей между победами и поражениями в командных видах спорта;
- Случайный лес наблюдался в таких приложениях, как выбор команды и тактический анализ в футболе.
Распространенные методы кластеризации машинного обучения и примеры —
- k - средства, используемые для разработки отличительных профилей команды на основе показателей эффективности или для определения различных моделей центра давления;
- иерархическая кластеризация применяется для изучения взаимосвязи между мотивацией и результатами у спортсменов и выявления когнитивных структур техники спортсмена;
- самоорганизующаяся карта, используемая для диагностики наличия утомления в моделях походки или визуализации изменений в стиле игры и коллективных движениях в командных видах спорта
Изучение общих правил связывания и примеры —
- Априори используется для выявления шаблонов ограничений в тренировочной среде и предпочтительных моделей игры в командных видах спорта.
- FURIA используется для измерения сходства в наборах биомедицинских данных и
в качестве основы для мониторинга прогресса реабилитации после травмы колена. - Рост FP используется для выявления злоупотребления гормоном роста и мониторинга питания у спортсменов.
Оценка модели
Машинное обучение позволяет использовать ряд методов оценки производительности моделей, каждый из которых имеет свои преимущества и недостатки. Абсолютные показатели, такие как среднеквадратическая ошибка или средняя абсолютная ошибка, распространены в моделировании отношений, в то время как относительные показатели, такие как коэффициент детерминации, часто известный как R-квадрат, направлены на определение дисперсии выходной переменной, которая объясняется переменные-предикторы. Качество соответствия модели также можно определить с помощью измерений информационных критериев, что делает их полезными для выбора модели.
Матрица путаницы — это инструмент, который часто используется при категоризации. Это предлагает тщательную оценку эффективности матрицы в различных контекстах.
Переоснащение и недообучение
С точки зрения спортивной науки идентификация талантов является примером переобучения, когда модель строится для прогнозирования результатов спортсмена в будущем с использованием исторических данных, полученных от успешных спортсменов в прошлом. Одно значение или линейная функция могут быть использованы в решении для недостаточной подготовки, чтобы классифицировать этих «успешных» или «неуспешных» спортсменов. Например, он может указать, что спортсмен должен соответствовать минимальным требованиям по росту или массе тела, чтобы преуспеть в конкретном виде спорта. Например, он может указать, что спортсмен должен соответствовать минимальным требованиям по росту или массе тела, чтобы преуспеть в конкретном виде спорта.
Сценарий, в котором обязательны многочисленные предварительные условия, такие как прохождение определенных контрольных показателей по физическим или техническим экзаменам, может представлять собой чрезмерное решение той же проблемы и может очень хорошо отображать конкретную группу населения или вид спорта, но не распространяться на новые когорты. К счастью, многие подходы к машинному обучению имеют встроенные функции для уменьшения или предотвращения переобучения, такие как параметры сложности и процедуры обрезки.
СБОР ДАННЫХ В СПОРТИВНЫХ НАУКАХ
Одной из причин более широкого применения таких методов в спортивной науке является их способность использоваться в самых разных областях. Это привело к тому, что использование машинного обучения распространилось на такие разные области, как:
- тренировочная нагрузка,
- модели развития талантов,
- автоматическое распознавание движений игрока в зависимости от вида спорта и
- масштабирование требований соответствия на основе антропометрических и половых различий,
На поле данные отслеживания игроков в сочетании с данными о событиях матча использовались для понимания сетей передач, определения и визуализации давления, моделирования внутрикомандных относительных фазовых связей, а также вероятностных моделей движения и зон контроля.
В арсенал современных спортивных ученых должен входить интеллектуальный анализ данных. Спортивному ученому теперь нужны как минимум глубокие знания в области интеллектуального анализа данных, машинного обучения и систем поддержки принятия решений, чтобы продвигаться в направлении исследований и преуспевать в прикладных ситуациях.
В этом блоге изложены основы интеллектуального анализа данных и машинного обучения, а также приведены примеры того, как эти области могут напрямую помочь людям и организациям, работающим в спортивных ситуациях. При правильном использовании интеллектуальный анализ данных и машинное обучение способны глубоко изменить то, как люди, работающие в спортивной индустрии, концептуализируют, воплощают новые идеи в жизнь и оценивают их.
Это в дополнение к повышению точности и эффективности принятия решений.
pip install sports_science: машинное обучение в науке о спорте — во второй части будут блоки кода для каждого примера, так что следите за новостями.
Счастливого обучения…!!