Взгляд актуария-стажера

Человеческая смертность не является детерминированным процессом (если только вы не живете в научно-фантастической антиутопии, где в качестве валюты используется остаток жизни). Таким образом, оценка будущих уровней смертности является одним из центральных предположений во многих советах, которые актуарии дают своим клиентам. Огромные усилия прилагаются для включения всех последних данных в модели ожидаемой продолжительности жизни человека и прогнозирования того, как она будет развиваться с течением времени по мере того, как мы прогнозируем будущее.

Хотя у нас есть общее представление о факторах, которые заставляют людей жить дольше или меньше, кажется, что всегда присутствует элемент случайности. Вместе с этим случайным элементом возникает риск долголетия — что особенно важно для организаций, денежные потоки которых зависят от продолжительности жизни людей. Например, пенсионная программа должна иметь представление о том, как долго ее участники будут жить, чтобы она могла эффективно управлять своими обязательствами и принимать правильные инвестиционные решения. Точно так же страховая компания должна предсказывать смертность держателей полисов с достаточной точностью, чтобы она могла установить соответствующий уровень премий — достаточно высокий, чтобы получать некоторую прибыль, но все же достаточно низкий, чтобы приносить пользу клиентам и оставаться конкурентоспособным на рынке страхования жизни.

В настоящее время процесс установления допущения о смертности может выглядеть примерно так:

  1. Выберите базовую таблицу — по общему признанию, довольно удручающий список вероятностей смерти человека в каждом году жизни;
  2. выбрать прогноз смертности, который определит, как показатели смертности в каждом возрасте будут меняться с течением времени; и наконец
  3. выполнить дополнительный анализ, чтобы адаптировать выбранную таблицу и прогноз в соответствии с конкретным демографическим профилем интересующей нас популяции.

Эти базовые таблицы и прогнозы часто обновляются (например, Непрерывное исследование смертности ежегодно обновляет свои прогнозы). Кроме того, в модель добавляются новые параметры, чтобы сделать ее более гибкой для разработчиков предположений (например, ознакомьтесь с этой информационной запиской по CMI_2018, опубликованной в марте 2019 г., в которой излагается введение новый параметр начальное добавление к улучшениям смертности). Тот факт, что мы постоянно пересматриваем наши модели и оценки смертности, должен быть достаточным, чтобы продемонстрировать, что прогнозировать, как долго люди будут жить на основе исторических данных, на самом деле довольно сложно. Существует, казалось бы, бесчисленное количество переменных, связанных с образом жизни, социально-экономическим положением и даже генетикой. Что мы должны сделать, чтобы наилучшим образом отразить наиболее значимые факторы, влияющие на продолжительность жизни человека — и ее эволюцию во времени — таким образом, чтобы мы могли обобщать это на более крупные группы населения?

Где появляется машинное обучение

Подход машинного обучения, основанный на данных, кажется, хорошо подходит для такого рода проблем. Ожидаемая продолжительность жизни — хорошо изученное явление, и было собрано много данных, чтобы облегчить наше понимание «правил» человеческой смертности. Машинное обучение породило ряд неконтролируемых алгоритмов, специально разработанных для таких задач, как выявление похожих точек данных (кластеризация) и поиск шаблонов и корреляций в данных (которые, можно сказать, попадают в области изучения правил ассоциации). Можно было бы простительно думать, что демографы будут повсюду использовать этот новый, появляющийся инструмент и использовать его всевозможными творческими способами, чтобы углубить наше понимание сложных взаимосвязей, которые управляют ожидаемой продолжительностью жизни.

В действительности, однако, применение машинного обучения в рамках изучения изменяющейся структуры населения до сих пор было несколько ограничено. В своей статье 2019 года Левантези и Пиццоруссо предполагают, что такая непопулярность связана с тем, что модели машинного обучения часто рассматриваются как черные ящики, результаты которых трудно объяснить и интерпретировать. По общему признанию, это обоснованная проблема — и в сообществе машинного обучения ведется множество текущих работ и дискуссий о важности объяснения, как и почему алгоритм ИИ пришел к выводу. он остановился, а также исследование практических методов демонстрации заинтересованным сторонам того, что модель принимает разумные и разумные решения.

Тем не менее, исследователи продолжают обобщать вклад, который был сделан до сих пор в области моделирования смертности от тех, кто использует подходы машинного обучения:

  • Оценка и улучшение согласия оценок, полученных с помощью стандартных стохастических моделей смертности (Deprez et al, 2017); и
  • применение нейронных сетей для выявления значимых факторов в прогнозировании смертности и расширения стандартных моделей смертности (Hainaut, 2018 и Richman and Wüthrich, 2018).

Затем Левантези и Пиццоруссо продолжают демонстрировать в той же статье, что они смогли зафиксировать закономерности, не идентифицируемые в рамках стандартных моделей смертности, путем введения параметра «оценка машинного обучения», идентифицированного их алгоритмом как обладающий прогностической силой. При этом они смогли повысить качество прогнозирования, когда результаты их модели машинного обучения использовались для поддержки стандартных моделей смертности.

Вы заметите, что ключевой темой вышеупомянутых статей является использование машинного обучения для поддержки, а не обязательно для замены традиционных подходов к моделированию смертности. Это кажется мне разумным подходом к продвижению вперед. Эксперты в области машинного обучения и демографии должны иметь возможность общаться и работать вместе, если мы хотим продвинуться дальше в нашем понимании факторов, влияющих на ожидаемую продолжительность жизни.

Традиционные подходы и подходы к машинному обучению, как известно, противоречили друг другу в области обработки естественного языка (NLP), в которой подходы, основанные на теории и правилах, изначально были почти отброшены в пользу методов, основанных на данных. настолько, что это привело к знаменитой цитате исследователя IBM Фредерика Елинека: Каждый раз, когда я увольняю лингвиста, производительность распознавателя речи повышается. Но даже в сообществе НЛП есть признаки того, что маятник может качнуться в другую сторону, и задаются вопросы о том, добьемся ли мы большего прогресса, если в исследованиях НЛП будет участвовать больше лингвистов (соответствующий доклад TWiML).

Не нужно большого воображения, чтобы увидеть параллели между исследованиями НЛП и моделированием демографии/смертности: каждая область изучает некую систему, в которой подходы, основанные на теории и правилах, дают (очевидно) разумные и полезные результаты — хотя есть и большой объем данных, из которых мы можем построить совершенно адекватные модели, не обладая таким глубоким уровнем знаний в предметной области.

Я бы посоветовал придерживаться сбалансированной точки зрения — нет смысла проявлять излишнюю сентиментальность в отношении разработанных вручную подходов, основанных на правилах, если они продолжают проигрывать альтернативным методам (таким, как машинное обучение), но мы должны оставаться открытыми к тому факту, что нам всегда будут нужны эксперты в предметной области, чтобы информировать о том, как мы разрабатываем и используем наши модели.

Вывод

Машинное обучение и искусственный интеллект играют важную роль в выявлении и прогнозировании тенденций смертности. Не подлежит сомнению, что эти методы являются мощным инструментом для выявления закономерностей и ассоциаций в точках данных и между ними, и что добавление такого рода анализа к существующим, более классическим подходам к моделированию смертности может быть полезным. Оптимальные результаты неизбежно будут достигнуты только тогда, когда будет найден баланс между более классическими подходами, основанными на правилах, и их более современными аналогами машинного обучения, основанными на данных.

Моделирование смертности всегда будет актуальным — если только а)вы случайно не открыли источник молодости, б)вы не придумали, как загрузить свое сознание в облако для всех вечность, или c)вы живете в вышеупомянутой научно-фантастической антиутопии (хотя это потенциально честная сделка, если это также означает, что вы станете Джастином Тимберлейком). Теперь наш мир не является антиутопией, но мы столкнулись с новыми тенденциями в ожидаемой продолжительности жизни, которых не предвидели даже эксперты, и мы также сталкиваемся с множеством новых проблем, когда сталкиваемся с последствиями старения нашего населения. .

Нам вполне могут понадобиться достижения в моделировании смертности, чтобы успешно справляться с проблемами, с которыми мы, безусловно, столкнемся в результате изменения нашей демографической структуры, и мы сможем сделать это только в том случае, если наши эксперты смогут отложить в сторону свою академическую лояльность и работать вместе на благо всех. Так что да, мы должны быть смелыми — мы должны адаптироваться и исследоватьновые технологии — но мы быстро потеряемся, если не будем помнить откуда мы пришли.

Кредиты и дополнительная информация

Эндрю Хетерингтон — актуарий, обучающийся на курсах, и энтузиаст данных из Лондона, Великобритания.

  • Загляните на мой сайт.
  • Свяжитесь со мной в LinkedIn.
  • Посмотрите, над чем я работаю на GitHub.

Обсуждаемый документ: Levantesi, S.; Пиццоруссо, В. Применение машинного обучения к моделированию и прогнозированию смертности. Риски 2019, 7, 26.

Фото песочных часов от Aron Visuals. Фото будильника от Icons8 Team. Оба на Unsplash.