Одной из основных причин, по которой я решил с головой погрузиться в разработку программного обеспечения, было желание исследовать мир интерактивных моделей. С самого детства меня интересовало, как статистика объясняет результат события. Я всегда уделял большое внимание спорту, и некоторые из моих самых ранних воспоминаний связаны с поиском в спортивной секции результатов бейсбольных матчей. Повзрослев, прочитав бестселлер Майкла Льюиса «Moneyball» и скорректировав свои взгляды на повествование о бейсбольной карточке о том, что средний результат — это конечная статистика (многие люди до сих пор отказываются от этого заблуждения), я решил принять революцию в аналитике. которые медленно проникали в спортивный мир.

Мне потребовалось некоторое время, чтобы смириться с тем фактом, что большинство людей все еще используют свое «чутье» при принятии решений, связанных со спортом (в каком-то смысле я до сих пор с этим не смирился). В то время как по своей сути дебаты ведутся между старой школой и новой школой стратегических идеологий, я полностью присоединяюсь к лагерю, что получение как можно большего количества относительной информации может только помочь принять разумное решение.

Я не могу точно сказать, когда именно это было, но в какой-то момент несколько лет назад я начал читать сайт статистического анализа FiveThirtyEight.com как основной источник анализа спорта и политики. В дополнение к блестящему написанию и подкрепленным цифрами доказательствам, FiveThirtyEight создает лучшие интерактивные модели в Интернете. Прославившийся тем, что они используют модели опроса для точного прогнозирования президентских выборов, основатель и главный редактор Нейт Сильвер расширил использование моделей своей командой для прогнозирования результатов бейсбола вплоть до прогнозирования того, кто выиграет Оскар в этом году. Эти модели помогают дать более точный взгляд на реальные, осязаемые события без встроенных предубеждений, присущих всем людям в отношении определенного набора результатов.

Я хотел бы внести свой вклад в это дело или, по крайней мере, расширить диапазон возможностей, которые могут создать эти модели. Не имея твердого опыта в программировании, я застрял в том, чтобы играть с числами в Excel, проверяя, могут ли они иметь смысл для определенных событий. Одной из самых больших задач, которую я взял на себя, было создание модели для создания идеального брекета March Madness. Один из самых захватывающих турниров года, я увидел большую неэффективность рынка в том, как были составлены сетки и какими они должны быть. После многих лет чтения так называемых «выборов экспертов» без лучшего доказательства, чем их собственная интуиция, я взял коэффициенты сетки FiveThirtyEight и начал играть с ними.

Самый важный способ определить эффективность сетки — точно знать, как работает система подсчета очков в пуле. Я каждый год играю в пуле, который награждает очками за разочарование, поэтому почти в каждом случае ожидаемая ценность выбора девятки перевешивает выбор восьмерки, поскольку каждая команда имеет около 50% шансов на победу. Я все еще вижу людей, которые годами собирали восемь семян, и для меня это означает, что они никогда не удосужились изучить правила подсчета очков, не понимают основ ожидаемых значений очков или имеют какое-то другое предубеждение. назад от принятия принципиально правильного выбора.

В некоторых из этих ранних игр есть четкие команды для выбора, чтобы максимизировать ваши ожидаемые очки, но не все игры так просты, как игра девять против восьми. Модель Excel, которую я создал, стремилась минимизировать предвзятость и принятие решений по выбору, чтобы можно было достичь максимальной ценности. Используя надежные коэффициенты FiveThiryEight из их собственной модели, я обработал их с помощью различных типов систем подсчета очков, используя уравнения ячеек, чтобы изменить формулу, которая дала мне наиболее ожидаемые баллы. Хотя я немного подправлял эту модель Excel каждый из последних нескольких лет, у меня никогда не было навыков программирования, чтобы превратить мою модель в более надежную симуляцию.

Войдите в General Assembly и погружной курс разработки программного обеспечения, который я начал. Впитывая материал через циклы, переменные и бесчисленные математические функции, созданные с помощью JavaScript и, в конечном итоге, из более дружественной к математике программы, такой как Python, я надеюсь добиться моделирования пула March Madness, которое никогда не было возможным в Excel. Моим самым большим дополнением к этой симуляции будет то, что вместо того, чтобы пытаться максимизировать ожидаемое общее количество очков, я попытаюсь максимизировать место отдельной группы в турнирной таблице (хотя они очень коррелируют друг с другом, они не всегда дают одни и те же цели). Это требует симуляции не только через желаемую скобку, но и через x количество скобок, которые также могут быть в пуле. Для этих групп я буду использовать инструмент распределения пиков Yahoo, который показывает, какой процент всех пользователей Yahoo выбрал определенную команду, чтобы пройти определенное количество раундов.

Используя несоответствие между тем, что выбрали пользователи, и тем, какие команды должны быть выбраны на основе перечисленных выше факторов, я надеюсь создать симуляцию, которая бросает вызов традиционному взгляду на то, что делать выбор не более искусно, чем слепо бросать дротики в доску. По мере того, как количество игроков в пуле растет, а шансы на победу уменьшаются, я надеюсь прояснить непонимание людьми закона малых чисел и показать, что с помощью хорошо построенных моделей можно лучше объяснить спортивные результаты.