сколько бинов с учетом некоторых данных

Мне нужно построить некоторые данные, используя гистограммы. Мои данные находятся между [0,1], без больших концентраций в какой-либо конкретной точке.

Каково хорошее соотношение между количеством выборок и количеством ячеек (одинаковой длины)?


person Ricky Robinson    schedule 21.08.2012    source источник


Ответы (1)


Обычно я использую квадратный корень из числа выборок в качестве количества ячеек. Это самый простой вариант из перечисленных при обсуждении подходящего количества интервалов в статье о гистограмме Википедии. Из этой статьи

Не существует «наилучшего» количества бинов, и разные размеры бинов могут выявить разные характеристики данных. Некоторые теоретики пытались определить оптимальное количество интервалов, но эти методы обычно делают серьезные предположения о форме распределения.

Использование квадратного корня из числа выборок обычно является хорошей отправной точкой, если вы не хотите делать предположения о распределении ваших данных.

person Chris    schedule 21.08.2012
comment
Спасибо, это как раз мой случай. Никаких предположений о моем распределении данных. - person Ricky Robinson; 21.08.2012