Ошибка выборки

Разница между наборами выборок известна просто как ошибка выборки.

Выборки составляют небольшую часть генеральной совокупности, и ошибка выборки также известна как вариация из-за выборки.

Например, предположим, в Индии, каков средний возраст клиента, вкладывающего средства в фиксированный депозит?

Невозможно измерить каждую точку данных, поэтому мы берем случайную выборку людей с севера, юга, востока и запада. Для северной выборки средний возраст составляет 55 лет, для южной выборки средний возраст составляет 58 лет, для восточной выборки средний возраст составляет 56 лет и, наконец, для западной выборки средний возраст составляет 59 лет. Разница в возрасте между выборками называется ошибка выборки или отклонение из-за выборки.

ПРИМЕЧАНИЕ. Поэтому всякий раз, когда мы оцениваем параметр выборки вместо генеральной совокупности, вместо точного числа мы должны указывать интервал. В приведенном выше примере мы бы сказали, что средний возраст клиента, который инвестирует в FD, составляет от 55 до 58 лет с достоверностью 95%.

Стандартная ошибка

Стандартная ошибка — это когда среднее значение совокупности не равно среднему значению выборки.

Стандартная ошибка – это мера неопределенности выборочного среднего. Чем выше стандартная ошибка, тем менее мы уверены в среднем значении выборки.

Стандартная ошибка = стандартное отклонение / количество выборок.

Например, предположим, каков средний возраст клиента, инвестирующего в FD?

Возьмем 5000 проб, средний возраст клиентов, инвестирующих в ФД, 55 лет. Доверия мало.

Возьмем 10 000 образцов, средний возраст клиентов, инвестирующих в FD, — 55,8 лет. Уверенность хорошая (лучше, чем раньше).

Возьмем 50 000 образцов, средний возраст клиентов, инвестирующих в FD, составляет 55,2 года. Уверенность очень хорошая (лучше, чем раньше).

Таким образом, по мере того, как мы увеличиваем размер выборки, достоверность растет. Другими словами, увеличение размера выборки приводит к увеличению размера совокупности. Таким образом, когда доверие растет, стандартная ошибка снижается.

Методы отбора проб

Существует множество методов выбора выборки из генеральной совокупности. В основном они подразделяются на вероятностную выборку и невероятностную выборку.

Вероятностная выборка

Техника случайной выборки. Каждый элемент генеральной совокупности имеет равные шансы попасть в выборку.

Например, простая случайная выборка, все точки данных имеют равные шансы быть отобранными в наборе выборки. В стратифицированной выборке есть страты, которые означают меньшие группы на основе некоторого фильтра. Например, гендерное распределение инвестиций в ФО. Здесь пол — это страты или фильтр.

Невероятностная выборка

Метод неслучайной выборки. Другими словами, выборки необъективны.

Например, целевая выборка означает выборку, которая лучше всего соответствует цели. Например, мы хотим показать, что мужчины больше инвестируют в ФД, чем женщины, поэтому мы соответствующим образом выберем нашу выборку, в которой мужчин больше, чем женщин.

Итак, каков подходящий размер выборки?

Ответ: степень изменчивости размера выборки.

Большая изменчивость в совокупности. Если в совокупности существует большая дисперсия, нам нужно взять большую выборку.

Меньшая изменчивость в генеральной совокупности: если в генеральной совокупности имеются небольшие различия, нам нужно взять небольшой размер выборки.

Если статья была вам полезна, поставьте лайк. Спасибо и пожалуйста, следуйте :

Среда: https://medium.com/@sandipanpaul

GitHub: https://github.com/sandipanpaul21