Профессор Кристоф Шумахер

Когда правительство публикует свои оценки ВВП за предыдущий квартал, мы всегда проверяем, насколько точны были наши прогнозы машинного обучения. До того, как пандемия поразила наши берега и наше экономическое состояние, наши прогнозы были очень близки к официальным цифрам и во многих случаях точны.

Однако на этот раз наши квартальные и годовые прогнозы роста на 4 квартал 2020 года, составлявшие около -4% и -3,7% соответственно, были значительно более пессимистичными, чем только что опубликованные значения -1,0% (ежеквартально) и -2,9% (годовые). Чем могло быть вызвано это несоответствие? Стоит выделить три момента.

Во-первых, GDPLive работает на основе ансамблевого алгоритма машинного обучения, который очень хорошо делает прогнозы, когда имеется достаточно прошлых данных, на которых алгоритм может учиться. Однако все усложняется, если данных для обучения недостаточно. Блокировка произошла во втором квартале 2020 года, и до сегодняшнего дня правительство публиковало только квартальные и годовые темпы роста ВВП за второй и третий кварталы. Таким образом, GDPLive имеет только два исторических значения, на которых можно извлечь уроки с момента остановки экономики — этого недостаточно для стабильно хороших прогнозов. С исследовательской точки зрения он подчеркивает области, в которых машинное обучение нуждается в дальнейшем развитии, поскольку более традиционные модели прогнозирования, основанные на человеке, могут по-прежнему иметь преимущество в прогнозировании очень внезапных, необычных событий с недостаточным объемом данных.

Во-вторых, во время карантина модели потребления Kiwi изменились практически за одну ночь. Одним из больших изменений стало значительное увеличение онлайн-расходов, вызванное закрытием розничных магазинов и необходимостью социального дистанцирования. Эта тенденция, вероятно, сохранится, даже несмотря на то, что большую часть времени мы возвращаемся к обычному бизнесу. GDPLive частично основан на данных о продажах в магазине, а это означает, что изменение поведения в отношении расходов может негативно повлиять на качество прогноза.

В-третьих, данные, публикуемые правительством, являются оценками ВВП и часто пересматриваются на более позднем этапе. Эти изменения могут быть существенными и не так хорошо рекламируются. Это означает, что мы знаем, насколько хороши или плохи наши прогнозы, только после внесения поправок.

GDPLive — это первый в мире предсказатель ВВП на основе машинного обучения. Как и мы, он пытается понять влияние событий, развернувшихся в 2020 году. Чем больше данных будет доступно, тем больше он сможет узнать и тем лучше будут прогнозы.