Байесовский ML как парадигма построения статистических моделей.

Во многих сценариях, особенно при обнаружении рака / опухоли и в здравоохранении, есть случаи, когда точечная оценка за чистую монету часто может иметь катастрофические последствия. Чрезвычайно необходимо более глубокое понимание того, как работает базовая модель.

Например, никто не захочет наивно доверять результатам модели прогнозирования рака МРТ, не имея хотя бы некоторых знаний о том, как эта модель работает. В идеале группы по анализу данных хотели бы иметь объективную сводку параметров модели с доверительными интервалами и другими статистическими самородками и, следовательно, иметь возможность рассуждать о них, используя язык вероятности.

Именно здесь байесовские модели набирают популярность и получают более широкое распространение.

Байесовский ML

Байесовский ML - это парадигма построения статистических моделей на основе теоремы Байеса.

Цель байесовского ML - оценить апостериорное распределение (p (θ | x)) с учетом правдоподобия (p (x | θ)) и априорного распределения p (θ). Вероятность - это то, что можно оценить по данным обучения.

Методы байесовского машинного обучения

Максимум апостериори (MAP)

Когда мы обучаем обычную модель машинного обучения, мы фактически выполняем оценку максимального правдоподобия, итеративный процесс, который обновляет параметры модели в попытке максимизировать вероятность увидеть обучающие данные 'x', которые уже видели параметры модели 'θ '.

В байесовском мире мы переворачиваем ситуацию с ног на голову, поскольку в этом случае мы фактически стремимся максимизировать апостериорное распределение, которое принимает обучающие данные как фиксированные и определяет вероятность установки любого параметра θ с учетом этих данных. Этот процесс называется апостериорным максимумом (MAP).

Хотя MAP - это первый шаг к полностью байесовскому машинному обучению, он все еще вычисляет только то, что статистики называют точечной оценкой, то есть оценкой значения параметра в одной точке, рассчитанной на основе данных. Обратной стороной точечных оценок является то, что они мало что говорят о параметре, кроме его оптимальной настройки. На самом деле нам часто нужна другая информация, например, насколько мы уверены в том, что значение параметра должно попадать в этот заранее заданный диапазон.

Цепь Маркова Монте-Карло ( MCMC)

Это более известная часть байесовского ML. По сути, этот метод и методы под этим зонтиком работают путем построения известной цепи Маркова, которая превращается в распределение, эквивалентное апостериорному. Ряд последовательных алгоритмов улучшают методологию MCMC за счет использования градиентной информации, что позволяет сэмплеру более эффективно перемещаться по пространству параметров.

MCMC и его родственники часто используются как вычислительный винтик в более широкой байесовской модели. Их обратная сторона заключается в том, что они часто очень неэффективны в вычислительном отношении, хотя этот недостаток был значительно улучшен в последние годы.

Гауссовский

Одним из популярных байесовских методов, способных выполнять как классификацию, так и регрессию, является гауссовский процесс. Фактически, эти процессы дают возможность выполнять регрессию в функциональном пространстве.

Вместо того, чтобы выбирать одну строку, которая наилучшим образом соответствует вашим данным, вы можете определить распределение вероятностей в пространстве всех возможных строк s, а затем выбрать строку, которая с наибольшей вероятностью соответствует данным в качестве фактического предиктора. Это байесовская оценка в прямом смысле слова, поскольку полное апостериорное распределение вычисляется аналитически. Возможность фактически отработать метод в этом случае связана с пригодностью сопряженных функций.

Заключение

В целом байесовское машинное обучение - это быстро развивающийся метод машинного обучения. У него есть различные приложения в некоторых из наиболее важных областей, где применение машинного обучения имеет решающее значение. В ближайшие годы эти методы будут развиваться еще более быстрыми темпами, поскольку достижения в области компьютерного оборудования и статистических методологий будут продолжать совершенствоваться.

Заинтересованы в изучении науки о данных?



Подпишитесь на нашу новостную рассылку Acing AI, если вам интересно: