Как работает суррогатное правдоподобие, часть 1 (машинное обучение)

Статистический вывод случайных графиков с помощью суррогатной функции правдоподобия (arXiv)

Аннотация: Спектральные оценки широко применяются в статистическом сетевом анализе, но они не включают в себя информацию о правдоподобии модели сетевой выборки. В этой статье предлагается новая суррогатная функция правдоподобия для статистического вывода класса популярных сетевых моделей, называемых графиками случайных скалярных произведений. В отличие от структурно сложной точной функции правдоподобия, суррогатная функция правдоподобия имеет разделимую структуру и является логарифмически вогнутой, но при этом хорошо аппроксимирует точную функцию правдоподобия. С частотной точки зрения мы изучаем оценку максимального суррогатного правдоподобия и устанавливаем сопутствующую теорию. Мы показываем его существование, уникальность, свойства больших выборок и то, что он улучшает базовую спектральную оценку с меньшей суммой квадратов ошибок. Удобный в вычислительном отношении алгоритм стохастического градиентного спуска предназначен для нахождения на практике оценки максимального суррогатного правдоподобия. С байесовской точки зрения мы устанавливаем теорему Бернштейна — фон Мизеса об апостериорном распределении с суррогатной функцией правдоподобия и показываем, что полученные в результате достоверные множества имеют правильное частотное покрытие. Эмпирическая эффективность предложенных методов, основанных на суррогатном правдоподобии, подтверждается посредством анализа примеров моделирования и реального набора графических данных Википедии. Пакет R, реализующий предложенные алгоритмы вычислений, находится в открытом доступе по адресу https://fangzheng-xie.github.io./publication/.

2. Суррогатные вероятности для выборки по значимости с вариационным отжигом (arXiv)

Автор : Мартин Янковяк, Дю Фан

Аннотация: Вариационный вывод — это мощная парадигма для приближенного байесовского вывода с рядом привлекательных свойств, включая поддержку обучения модели и подвыборки данных. Напротив, методы MCMC, такие как гамильтониан Монте-Карло, не обладают этими свойствами, но остаются привлекательными, поскольку, в отличие от параметрических методов, MCMC асимптотически несмещены. По этим причинам исследователи стремились объединить сильные стороны обоих классов алгоритмов, а последние подходы приблизились к реализации этого видения на практике. Однако поддержка подвыборки данных в этих гибридных методах может стать проблемой и недостатком, который мы устраняем, вводя суррогатную вероятность, которую можно изучить совместно с другими вариационными параметрами. Теоретически мы утверждаем, что полученный алгоритм позволяет пользователю сделать интуитивный компромисс между точностью вывода и вычислительными затратами. В ходе обширного эмпирического сравнения мы показываем, что наш метод хорошо работает на практике и хорошо подходит для вывода методом «черного ящика» в средах вероятностного программирования.

Как работает суррогатное правдоподобие, часть 1 (машинное обучение)

Вопросы по теме