Вычисление доверительных интервалов по эмпирическому распределению, полученному методом начальной загрузки

Я рассчитал эмпирическое распределение среднего значения выборки, используя метод начальной загрузки, но теперь мне также нужно будет рассчитать доверительный интервал для среднего значения совокупности, используя найденное эмпирическое распределение.

Есть ли способ сделать это автоматически в Matlab с учетом моего состояния? Если нет, то как бы вы нашли 95% доверительный интервал для среднего значения генеральной совокупности?


person nbro    schedule 16.12.2015    source источник


Ответы (1)


Начальные доверительные интервалы для среднего значения в том виде, в каком вы его вычислили, являются квантилями распределения. Таким образом, это может быть так же просто, как

quantile(myBootstrappedMeans, [0.05, 0.95])

Это даст 90% доверительный интервал для вектора myBootstrappedMeans. Для справки: http://math.usask.ca/~longhai/doc/talks/slide-bootstrap.pdf

0,05 и 0,95 относятся к 90% доверительному интервалу (средние 90% данных). Для другого доверительного интервала вам просто нужно выбрать средние квантили этих данных. Итак, для 95% вы должны использовать 0,025 и 0,975. Чтобы обобщить, вы должны использовать (1-level)/2 и (0.5 + level/2), где level — это доверительный интервал (или уровень достоверности), который вы хотите.

person Bill Denney    schedule 16.12.2015
comment
Хорошо спасибо. Но что означает название функции (квантиля), которую вы используете? Я понял, что он возвращает крайние значения интервала, какое отношение к этому имеет слово квантиль? Из документации Matlab я не уверен, что понимаю. Я действительно новичок в этих вещах. - person nbro; 16.12.2015
comment
@rbro функция quantile возвращает квантили набора данных. Например, квантиль 0,5 является медианой, а квантили 0,25, 0,5 и 0,75 вместе называются квартилями. Возможно, вы также слышали о термине процентиль — 100 * q-й процентиль совпадает с q-м квантилем. - person Chris Taylor; 16.12.2015
comment
Речь идет не только о захвате средних 95% распределения, но также (и, возможно, что более важно) о нахождении самого короткого интервала, который это делает. - person ayorgo; 29.06.2019
comment
@ayorgo, хотя доверительные интервалы (ДИ) не уникальны, они обычно не рассчитываются как кратчайший интервал. Доверительные интервалы обычно рассчитываются по квантилям данных одним из трех способов: по центру (где 90-процентный доверительный интервал изменяется от квантилей от 0,05 до 0,95) и по правому или правому краю (где 90-процентный доверительный интервал может изменяться от 0,1 до 0,9 квантили). Самый короткий интервал выберет более высокую долю данных на более сжатой стороне асимметричного распределения. Я не знаю области, где это делается. (Хотя я счастлив узнать об одном!) - person Bill Denney; 07.07.2019