Оглядываясь назад, месяц кажется вечностью, если рассматривать все, что произошло на ЧМ-2018. Но если вы можете вспомнить это далекое прошлое, вы можете вспомнить заголовки, в которых доминировали не только букмекерские конторы, но и модели искусственного интеллекта и машинного обучения.

Неудивительно, что Бразилия, Германия и Испания

MIT Technology Review сделал несколько разных прогнозов. Во-первых, они объединили варианты от нескольких букмекеров, чтобы составить список наиболее вероятных победителей, дав Бразилии шанс на победу 16,6%, Германии 12,8% и Испании 12,5%. Затем в статье были представлены результаты модели, разработанной Андреасом Гроллом из Технического университета Дортмунда в Германии, в которой применялась комбинация машинного обучения и статистики. Эта модель охватывала широкий спектр переменных, включая экономические факторы, такие как ВВП и население (привет Бельгии и Хорватии!), рейтинг ФИФА, а также факторы команды/игрока, такие как возраст, количество суперзвезд, домашнее преимущество и т. д. Из этой модели возникла Испания как вероятный победитель, с добавлением того, что Германия выиграет кубок, если они выйдут в четвертьфинал.

Еще менее удивительно: Бразилия против Германии

Goldman Sachs также предпринял попытку предсказать турнир, с предсказуемыми результатами (каламбур), показывающими, что Бразилия забирает домой кубок.

Для справки: в 2010 году осьминог-экстрасенс Пол предсказал 12 из 14 игр чемпионата мира, включая финал.

Так что же пошло не так?

Во-первых, при работе с прогностическими моделями обратная связь имеет решающее значение, особенно при изменении факторов. В случае с этим турниром многое изменилось вскоре после выпуска моделей, в том числе:

  • увольнение главного тренера сборной Испании
  • игроки, получившие красные и желтые карточки
  • Иранские фанаты всю ночь пели возле комнаты Роналду

Характер спорта также делает предсказание очень трудным. В документе, написанном бразильскими учеными, рассматриваются проблемы, связанные с прогнозированием победителей в четырех различных видах спорта: баскетболе, волейболе, гандболе и футболе. Их результаты показывают, что мастерство и удача влияют по-разному в зависимости от вида спорта. В видах спорта с большим количеством очков мастерство является очень сильным фактором прогнозирования. Точно так же турниры в формате best-of-x также выигрывают от мастерства игрока. Удача играет гораздо более важную роль в низко результативных видах спорта, таких как футбол, или в форматах турниров на выбывание.

Что мы можем извлечь из этого?

Во-первых, машинное обучение — это не панацея. Простое создание статической модели без ее регулярного обновления поставит вашу организацию в потенциально худшее положение, чем отсутствие разработки модели.

Во-вторых, важно знать, когда и где развертывать статистическую модель или модель машинного обучения. Бедняги, которые построили модели прогнозирования чемпионата мира, играли против колоды в спорте, где удача является огромным фактором. Точно так же в корпоративной среде статистические модели не всегда могут быть подходящими или, по крайней мере, их лучше использовать для решения различных задач.

И, наконец, всегда помните, что понимание отрасли, особенно от экспертов в вашей области, не менее, если не более важно, чем модели. Предположительно, у создателей этих моделей машинного обучения не было возможности пересмотреть свои предположения с игроками, тренерами или другими инсайдерами. По иронии судьбы, человек, который сделал лучшие прогнозы, был бывшим игроком по имени Стив Макманаман, который правильно предсказал 12 из 14 матчей плей-офф чемпионата мира. Никогда не забывайте, что ваши эксперты в предметной области обладают обширными знаниями, которых нет у машины.

Принимайте решения на основе данных. В 3AG Systems мы помогаем компаниям совершенствоваться, превращая их данные в полезную информацию. Узнайте больше на 3agsystems.com