Жизнь как рандомизированная задача оптимизации

Предположим, цель жизни может быть выражена в некоторой математической функции. Эта функция будет отражать количество денег, которые у вас есть, количество значимых отношений в вашей жизни, ваше психическое и физическое здоровье и любые другие факторы, которые вы считаете важными. Функция будет принимать в качестве входных данных состояние вселенной и выводить число, определяющее, насколько вы удовлетворены жизнью. Поскольку у всех нас разные ценности и цели, функции у всех разные.

Естественно, целью жизни было бы максимизировать их функцию, но это не так просто. Поведение этой функции не очень прозрачно. Учитывая какое-то другое состояние вселенной, мы не можем быть уверены, будет ли функция оцениваться выше или ниже, или как она будет развиваться с течением времени. Когда мы задаем себе такие вопросы, как «насколько я был бы счастлив, если бы встречался с ним/ней?» или «насколько успешным я был бы, если бы выбрал этот карьерный путь?» мы действительно не знаем ответа наверняка, если мы не живем в той другой вселенной. Однако по мере того, как мы идем по жизни, мы получаем информацию и разрабатываем эвристики для оценки состояний.

Так как же максимизировать эту функцию в долгосрочной перспективе? Что ж, так уж получилось, что оптимизация функций черного ящика хорошо изучена в области рандомизированной оптимизации.

Исследование и разработка

Существует два общих подхода к принятию решений: разведка и эксплуатация. Исследование — это идея о том, что нам не всегда нужно предпринимать действия, которые принесут нам наибольшую пользу; иногда нам выгодно делать случайный выбор. Исследуя варианты, выходящие за рамки того, что очевидно хорошо прямо сейчас, мы можем наткнуться на состояния более быстрого улучшения и больших высот.

Эксплуатация – это действие, которое приносит наибольшую пользу. Это также называется жадным подходом, поскольку мы делаем только то, что лучше для нас сейчас, но не думаем о возможностях, которые находятся за пределами нашей текущей досягаемости.

Восхождение на холм / градиентное восхождение

Самый простой способ прожить жизнь — жить одним днем, максимизируя только нашу функцию в локальной области. В оптимизации этот алгоритм называется Hill Climbing или Gradient Ascent.

В нашей жизни мы можем с некоторой уверенностью предсказать, улучшит ли какое-то состояние-кандидат нашу функцию или нет, но только если этот кандидат очень похож на наше текущее состояние. Например, я знаю, что рамен сегодня вечером сделает меня счастливее, чем брокколи, поэтому я выберу первое, чтобы максимизировать свою функцию. Однако у этого подхода есть серьезные недостатки, заключающиеся в том, что вы можете пожертвовать долгосрочными преимуществами ради краткосрочной выгоды и недостаточно изучить альтернативные пути.

Имитация отжига

Более сбалансированный подход к жизни состоял бы в том, чтобы включить некоторые исследования в эксплуатацию, время от времени рисковать. Хорошо известный алгоритм под названием Simulated Annealing делает именно это. Идея состоит в том, что существует установленный «температурный» график, который диктует, насколько вы готовы сделать бесполезный шаг. Со временем температура снижается, и алгоритм делает только эксплуататорские ходы. Это аналогично терпимости к риску в нашей повседневной жизни. Поскольку мы моложе, лучше исследовать различные типы состояний, это могут быть академические интересы, карьерные интересы или выбор романтических партнеров. По мере того, как мы становимся старше, лучше не делать так много шагов вниз (т. е. больших рисков) и вместо этого сосредоточиться на улучшении на основе вашего местного соседства штатов.

Оценка алгоритмов распределения

Один важный аспект, который не учитывают приведенные выше алгоритмы, заключается в том, что по мере того, как вы оцениваете функцию в разных состояниях, функция становится менее «черным ящиком». Вы получаете информацию о том, где могут лежать оптимумы и как вы можете их достичь. Алгоритмы оценки распределения (EDA) используют эту идею и создают распределение-кандидат, которое уточняется после каждого действия с новой полученной информацией. Это помогает значительно улучшить процесс оптимизации и обычно позволяет пользователю найти оптимум за гораздо меньшее количество шагов, чем без него. Однако компромисс заключается в том, что вы тратите больше времени на каждом шаге, добавляя новую информацию в распределение-кандидат.

Аналогия в жизни заключается в том, что по мере приобретения опыта вы учитесь на этом опыте и создаете ментальную модель того, что может улучшить вашу жизненную функцию. Вы узнаете, что делает вас счастливым, что приносит вам больше денег, и другие ключевые знания, которые позволяют вам в некоторой степени предвидеть результаты ваших решений. Однако эта информация не идеальна, это всего лишь эвристика. Размышляя и занимаясь самоанализом, мы можем строить более совершенные ментальные модели своей жизненной функции и принимать более полезные решения в своей жизни.

Первоначально написано: 7 марта 2019 г.

Жизнь как рандомизированная задача оптимизации

Исследование и разработка

Восхождение на холм / градиентное восхождение

Имитация отжига

Оценка алгоритмов распределения

Вопросы по теме