Используя принципы машинного обучения в сочетании со спортивной аналитикой и логистическим регрессионным анализом, я использовал базовую статистику игроков НБА с 2000 по 2022 год, включая очки, передачи, подборы, перехваты, блоки и победы, и создал модель логистической регрессии на основе их характеристики как победитель MVP в этом конкретном сезоне или нет (поскольку он имеет биномиальный тип). Используя данные о поездах за 2000–2022 годы, я применил их к тестовым данным за 2023 год, чтобы проверить, сможет ли он точно предсказать победителя MVP сезона НБА 2022–23 годов.

С тренировочными данными модель логистической регрессии точно предсказала 18 из 23 победителей MVP, но этот высокий процент не отразился на тестовых данных, поскольку победителем MVP НБА 2023 года был ошибочно предсказан Никола Йокич, а обладатель награды Джоэл Эмбиид имел только четвертая по величине вероятность получить награду MVP НБА в прошлом сезоне.

Тем не менее, цель этого состояла в том, чтобы внести свой вклад в более крупное исследование, которое я провожу, в котором сравниваются эти модели машинного обучения и регрессии для прогнозирования победителей NBA MVP на основе базовой статистики или расширенной статистики. Моя следующая задача будет заключаться в том, чтобы определить, какие расширенные статистические данные надежны для измерения производительности, и посмотреть, будут ли они предсказывать MVP в большей степени (или продемонстрировать, что журналисты и судьи, отвечающие за выбор MVP, не знают об использовании расширенных статистических данных). .

Десять изображений включают сезон 2023 года в качестве тестовых данных, пять сезонов, которые ошибочно предсказали победителя MVP, и несколько других интересных сезонов с точки зрения наблюдаемых вероятностей.

Я надеюсь создать исследовательскую работу из всей этой совокупной работы, которая может быть опубликована. Я действительно заинтересован в том, чтобы перейти к методам машинного обучения для создания проектов спортивной аналитики.

#sportsanalytics #basketball #nba #basketballanalytics #machinelearning #datascience #dataanalytics