Обзор

Задача этого резюме состоит в том, чтобы объяснить сложную статью простым способом, с

  • требуется сверхминимальная математика (в данном случае это довольно сложно)
  • многоуровневая структура, поэтому читатель может открывать все больше и больше деталей по своему усмотрению

Оригинал статьи: https://arxiv.org/abs/1810.05558?fbclid=IwAR2Irobgi5jW_RVJL4iRyv0QS_WfmgzKk-KmyoeXSZf3X26eFkz8gaTRxk4



TL;DR

  • Выполнение Байесовского вывода имеет множество очень важных практических применений.
  • Это означает оценку вычисления апостериорной вероятности и предельного правдоподобия или доказательства.
  • К сожалению, это неразрешимо вообще, поэтому необходимо вычислить аппроксимации для обоих
  • В целом существует 2 подхода: вариационные методы и методы Монте-Карло, основанные на компромиссе между знанием функции (доступ к производным) или эффективностью выборки.
  • Эффективность сэмплирования — это ключевая функция, позволяющая сделать это на практике.
  • MCMC — это стандартный инструмент для байесовского вывода, но он не очень эффективен.
  • Эта статья представляет VBMC как новый эффективный инструмент байесовского вывода с выборкой.

Некоторые детали (уровень 1)

Проблема

Допустим, у нас есть параметрическая модель, и с учетом набора данных мы хотим оценить функцию плотности вероятности (PDF) каждого из ее параметров.

В этом случае у нас есть \Theta как полное пространство параметров

Эта проблема теоретически смоделирована в байесовской структуре, и ее решение состоит в выполнении байесовского вывода, для которого существуют некоторые инструменты, такие как MCMC, однако есть некоторые проблемы, ограничивающие его прямое использование на практике, в основном связанные с вероятностью

Вероятность

В общем, давайте рассмотрим вероятность модели как сложную функцию «черного ящика» (например, представьте, что это большая нейронная сеть).

Таким образом, единственный способ узнать что-то об этом — это попробовать (например, черный ящик, предоставить входные данные и наблюдать за выходом).

В идеале с неограниченным бюджетом оценки мы могли бы реконструировать эту функцию с произвольной точностью, однако на практике бюджет оценки ограничен по сравнению со сложностью правдоподобия, поэтому его необходимо аппроксимировать с использованием примеров эффективных методов аппроксимации

Реалистичные вероятности сложны:

  • высокий размерный
  • Мультимодальный (много мин. и макс.)
  • Тяжелые хвосты (экстремальные события)
  • Коррелированные параметры

Инструменты

  • Вариационный подход
  • Активный сэмпл
  • Гауссовский процесс

Вариативный подход — основная идея

Замените сложную истинную апостериорную вероятность на более простую PDF, называемую вариационной апостериорной, подгоняя ее параметры в рамках минимизации несходства, используя надлежащую меру подобия PDF (например, расстояние KL).

Вариационный вывод выполняется с помощью оптимизации, и его решение дает 2 результата.

  • апостериорное приближение
  • приближение доказательств (ELBO)

Активная выборка

Состоит из наличия алгоритма для разумного выбора того, как выбрать неизвестную функцию (вероятность), чтобы максимизировать некоторые критерии при подгонке бюджета выборки.

С точки зрения математики алгоритм по существу состоит из решения конкретной задачи оптимизации, нацеленной на функцию сбора данных: функцию, которая связывает выборку с выбранными критериями (например, минимизация апостериорной дисперсии).

Подробнее (уровень 2)

ЭЛБО

Нижняя граница свидетельства (ELBO) имеет красивое название, говорящее само за себя: это нижняя граница истинного свидетельства (на байесовском жаргоне это знаменатель байесовской формулы).

Истинное свидетельство определяется как сумма расхождений ELBO и KL между Истинным и Вариационным апостериором, поэтому в результате того факта, что KL всегда неотрицательна по построению, мы имеем, что

  • ELBO — нижняя граница доказательства
  • чем больше апостериорная вариация похожа на истинную, тем лучше аппроксимация ELBO для доказательства

Вариационный подход в физике

Вариационный подход использовался в различных разделах физики, таких как статистическая механика, для выполнения аналитических вычислений апостериорных значений.

Чтобы сделать задачу аппроксимации поддающейся аналитическому рассмотрению, уловка заключается в выборе апостериорной вариации: например. при выборе факторизованной функции логарифмирование приводит к сумме, что может привести к решениям в закрытой форме

Это, конечно, происходит за счет расхождения KL (его значение настолько велико, насколько это простое приближение отличается от истинного).

Работа в процессе (скоро будут новые обновления)