Я создаю гистограммы замен: 1-я, 2-я или 3-я замена по времени. Таким образом, каждая гистограмма показывает количество подписчиков в данную минуту с учетом номера подписки. Гистограммы имеют смысл для меня, потому что по большей части они гладкие (я использовал ширину ячейки 1 минуту). Ничто не выглядит слишком необычным. Однако, когда я накладываю график плотности, хвосты слева раздуваются, и я не могу определить, почему для одного из графиков.
Набор данных состоит из замен, начиная с минуты 1 и заканчивая максимальным временем. Затем я разрезал этот набор данных пополам, чтобы посмотреть только, когда сабвуфер был сделан после 45-й минуты. Я не сворачивал эти данные и пытался создать воспроизводимый пример, но не могу предоставить данные.
Код, используемый для создания в R
## Filter out subs that are not in the second half
df.half<-df[df$PeriodId>=2,]
p<-ggplot(data=df.half, aes(x=time)) +
geom_histogram(aes(y=..density..),position="identity", alpha=0.5,binwidth=1)+
geom_vline(data=sumy.df.half,aes(xintercept=grp.mean),color="blue", linetype="dashed", size=1)+
geom_density(alpha=.2)+
facet_grid(SUB_NUMBER ~ .)+
scale_y_continuous(limits = c(0,0.075),breaks = c(seq(0,0.075,0.025)),
minor_breaks = c(seq(0,0.075,0.025)),name='Count')
p
Почему для First Sub график плотности раздувается в хвосте, если нет значений меньше 45? Кроме того, почему график плотности не более раздут в хвосте второго сабвуфера?
Боковое примечание: я задал этот вопрос на перекрестной проверке, но мне сказали, поскольку он касается R, вместо этого задать его здесь. Здесь
Поэтому я смог изменить код и получить следующее:
ggplot() +
geom_histogram(data=df.half, aes(x=time,y=..density..),position="identity", alpha=0.5,binwidth=1)+
geom_density(data=df.half,aes(x=time,y=..density..))+
geom_vline(data=sumy.df.half,aes(xintercept=grp.mean),color="blue", linetype="dashed", size=1)+
facet_grid(SUB_NUMBER ~ .)
Это выглядит более правильно и, по крайней мере, теперь соответствует набору данных. Тем не менее, я все еще не понимаю, почему эти проблемы возникли в первую очередь.
geom_histogram
? - person Oka   schedule 10.04.2019