Как оценить DAG (направленный ациклический граф) с помощью поиска в гору

Поиск холма

Hill Climbing — это эвристический алгоритм оптимизации, который итеративно движется к решению жадным образом, выбирая ход, который локально максимизирует заданную целевую функцию. Это простая форма оптимизации локального поиска, которую можно использовать для решения задач оптимизации в различных областях, включая искусственный интеллект, исследование операций и математику.

Введение

Hill Climbing — это простой алгоритм оптимизации, который пытается найти глобальный оптимум заданной целевой функции, делая итеративные шаги в направлении лучших решений. Алгоритм начинается с начального решения, а затем неоднократно выбирает лучшее соседнее решение (тот, который улучшает целевую функцию), пока не будет достигнут дальнейший прогресс. Hill Climbing — это жадный алгоритм, поскольку он всегда выбирает решение, которое кажется лучшим в текущий момент, не учитывая долгосрочные последствия своего выбора. Иногда это может привести к застреванию в локальном оптимуме вместо поиска глобального оптимума.

Приложения

Некоторые из распространенных приложений включают в себя:

Робототехника: Hill Climbing можно использовать для поиска наилучших управляющих входов для роботизированных систем для достижения желаемой цели.
Машинное обучение: Hill Climbing можно использовать для оптимизации гиперпараметров модели машинного обучения.
Исследование операций: восхождение на холм можно использовать для решения таких задач, как задача коммивояжера, где цель состоит в том, чтобы найти кратчайший путь, который проходит через множество городов и возвращается в начальный город.
Игровой ИИ: Hill Climbing можно использовать для обучения игровых агентов ИИ, находя лучшие ходы в игре.
Оптимизация функций: Hill Climbing можно использовать для нахождения глобального максимума или минимума математической функции.
Комбинаторная оптимизация: Hill Climbing можно использовать для решения таких задач, как задача о рюкзаке, где цель состоит в том, чтобы найти наиболее ценные предметы для упаковки в рюкзак с учетом ограничения веса.

Вот некоторые из приложений Hill Climbing. Алгоритм может быть адаптирован и объединен с другими методами оптимизации для решения широкого круга оптимизационных задач в различных областях.

Табличный набор данных

Hill Climbing можно применить к табличному набору данных, рассматривая каждую строку как потенциальное решение, а целевую функцию как метрику, которая оценивает качество каждого решения. Вот как алгоритм работает с табличным набором данных:

Инициализация: начните с начального решения, которым может быть случайно выбранная строка из набора данных или предварительно определенная начальная точка.
Оценка: Оцените целевую функцию для текущего решения, чтобы определить его качество.
Генерация соседей: Генерируйте набор соседних решений, внося небольшие изменения в текущее решение, например, переключая значения двух столбцов или добавляя небольшое количество случайного шума.
Выбор: выберите соседнее решение, которое приводит к наибольшему улучшению целевой функции.
Повтор: Повторяйте шаги 2–4 до тех пор, пока не будет найдено дальнейшее улучшение. На данный момент текущее решение считается лучшим решением, найденным до сих пор.
Завершение: если соблюдается критерий остановки, такой как достижение максимального количества итераций или нахождение достаточно хорошего решения, алгоритм завершает работу и возвращает лучшее найденное решение.

Повторяя эти шаги, восхождение на холм может сходиться к локальному оптимуму целевой функции, который может быть или не быть глобальным оптимумом. Производительность алгоритма можно улучшить, используя такие методы, как случайный перезапуск или включение случайности в выбор следующего решения.