«Извлеките уроки из истории для своего будущего, потому что история часто повторяется»

Все мы слышали пословицу «…. «История часто повторяется». Это напрямую связано с наукой предсказания. Простым объяснением предсказания является заявление о будущем, сделанное путем обращения к прошлым Данным. Прогнозную информацию можно определить как взаимную информацию между прошлым и будущим временного ряда. Современная наука во многом строится на предсказаниях и предположениях. В определенной степени большинство ученых регулярно используют прогнозирование в исследованиях как основу научного метода, когда они выдвигают гипотезу (предлагаемое объяснение некоторого наблюдаемого явления) и предсказывают, что произойдет.

Одними из самых больших сторонников предсказания в исследованиях являются физики-теоретики, такие как Эйнштейн и Хокинг. Они используют широкие и элегантные математические теории, чтобы предсказать, как, по их мнению, ведет себя Вселенная. Их предсказания на самом деле определяют направление целых научных парадигм, поскольку физики-эмпирики проверяют и пытаются фальсифицировать части теории, что приводит к уточнению и изменению. Астрономия дала несколько замечательных примеров предсказания в науке, в основном построенных на законах движения, предложенных Ньютоном. Одним из лучших примеров этого является открытие планеты Нептун, которое является свидетельством мастерства астрономов, а также работы Ньютона. Открытие этой планеты показало, что его работа в большинстве случаев верна — теория относительности объясняла физику в крайних масштабах.

В компьютерных науках существует очевидный интерес к практическим алгоритмам предсказания будущего, и, соответственно, существует большое количество литературы по проблеме экстраполяции временных рядов. Но предсказание одновременно больше и меньше экстраполяции. При приблизительном знании начальных условий системы и понимании законов природы можно рассчитать приблизительное поведение системы. Это предположение лежало в основе философии науки. Мы могли бы предсказать, например, вероятность дождя на предстоящей неделе, даже если мы не можем экстраполировать траекторию колебаний температуры. Компьютеры полагаются на то же предположение при управлении космическими кораблями; приблизительно точный ввод дает приблизительно точный вывод.

Прогнозирование — одна из фундаментальных проблем нейронных вычислений. Многое из того, чем мы восхищаемся в профессиональных действиях человека, носит предсказательный характер: разыгрывающий, который передает баскетбольный мяч в точку, куда через доли секунды прибудет его товарищ по команде, гроссмейстер, который знает, как сделанные сейчас ходы повлияют на конечный результат двух часов игры. следовательно, инвестор, который покупает акции в ожидании, что они вырастут в следующем году. В более общем смысле мы собираем сенсорную информацию не ради нее самой, а в надежде, что эта информация будет направлять наши действия (включая наши вербальные действия). Но действие требует времени, и чувственные данные могут направлять нас только в той мере, в какой эти данные информируют нас о состоянии мира во время наших действий, поэтому единственными компонентами поступающих данных, которые могут оказаться полезными, являются те которые предсказуемы.

Одним из важнейших примеров предсказания является явление обобщения в обучении. Обучение формализуется как нахождение модели, которая объясняет или описывает набор наблюдений, но опять же это полезно только потому, что мы ожидаем, что эта модель будет по-прежнему действительна. Говоря языком теории научения, животное может получить избирательное преимущество не за счет своих действий на обучающих данных, а только за счет своих действий при обобщении. Обобщение — а не «переобучение» обучающих данных — как раз и является проблемой выделения тех особенностей данных, которые имеют прогностическую ценность. Кроме того, мы знаем, что успех обобщения зависит от управления сложностью моделей, которые мы готовы рассматривать как возможные.

Наука о данных и прогнозирование

Прогнозное моделирование и машинное обучение занимают все более важное место в бизнес-моделях интернет-компаний, управляемых данными. Ранний успех, Paypal, смог захватить и доминировать в платежах от потребителя к потребителю благодаря своей способности прогнозировать распределение убытков для каждой транзакции и действовать соответствующим образом. Эта управляемая данными способность резко контрастировала с преобладающей практикой одинакового отношения к транзакциям с точки зрения риска. Прогнозное моделирование также лежит в основе поисковой системы Google и некоторых других продуктов. Но первой машиной, которая, возможно, может считаться прошедшей тест Тьюринга и создающей новые идеи в ходе решения проблем, является Watson от IBM, который широко использует обучение и прогнозирование в процессе решения проблем. В такой игре, как «Опасность!», где понимание самого вопроса часто нетривиально, а область открыта и нестационарна, нецелесообразно добиваться успеха за счет обширного перечисления возможностей или построения теории сверху вниз. Решение состоит в том, чтобы наделить компьютер способностью автоматически обучаться на большом количестве примеров. Уотсон также продемонстрировал, что возможности машинного обучения значительно усиливаются благодаря доступности высококачественных данных, подготовленных человеком, как в Википедии. Эта тенденция, объединяющая человеческие знания с машинным обучением, также, похоже, находится на подъеме. Недавний набег Google на Знания предназначен для того, чтобы система могла понимать сущности, соответствующие потоку строк, которые она постоянно обрабатывает. Google хочет понимать «вещи», а не только «строки».

Организации и менеджеры сталкиваются с серьезными проблемами при адаптации к новому миру данных. Внезапно появляется возможность проверить многие из их устоявшихся интуиций, дешево и точно экспериментировать и основывать решения на данных. Эта возможность требует фундаментального изменения организационной культуры, которое наблюдается в организациях, которые используют развивающийся мир данных для принятия решений.

МЫСЛИ

В рамках стремления человечества понять природу прогнозная наука получила гораздо более широкое распространение, чем раньше.

Во многом это связано с экспоненциальным ростом вычислительной мощности, что позволяет постепенно создавать более подробные и точные модели. Они очень полезны при прогнозировании погоды или стихийных бедствий, таких как землетрясения и цунами.

Другим фактором, стимулирующим этот рост прогнозов в исследованиях, являются политика и экономика. Прогнозирование погоды приносит пользу экономике, поскольку информирует фермеров о том, чего ожидать, и позволяет службам экстренной помощи предсказывать, когда неблагоприятная погода может потребовать принятия мер.

К сожалению, эти прогнозы в науке являются прихотью казначеев, будь то в правительстве или в частном секторе. Это всегда ставит под угрозу честность ученых, делающих прогнозы, но прогнозирование в исследованиях всегда будет управлять научным методом. Во всяком случае, это мой прогноз!