Мне нужно построить некоторые данные, используя гистограммы. Мои данные находятся между [0,1], без больших концентраций в какой-либо конкретной точке.
Каково хорошее соотношение между количеством выборок и количеством ячеек (одинаковой длины)?
Мне нужно построить некоторые данные, используя гистограммы. Мои данные находятся между [0,1], без больших концентраций в какой-либо конкретной точке.
Каково хорошее соотношение между количеством выборок и количеством ячеек (одинаковой длины)?
Обычно я использую квадратный корень из числа выборок в качестве количества ячеек. Это самый простой вариант из перечисленных при обсуждении подходящего количества интервалов в статье о гистограмме Википедии. Из этой статьи
Не существует «наилучшего» количества бинов, и разные размеры бинов могут выявить разные характеристики данных. Некоторые теоретики пытались определить оптимальное количество интервалов, но эти методы обычно делают серьезные предположения о форме распределения.
Использование квадратного корня из числа выборок обычно является хорошей отправной точкой, если вы не хотите делать предположения о распределении ваших данных.