Блочная диаграмма, включающая выбросы в R, позволяет сравнивать все диапазоны.

Я сравниваю несколько значений, используя R, это 8 переменных, хранящихся в 1000 векторах длины. Это означает, что матрица 1000 * 8, 8 столбцов представляют 8 переменных.

Тогда я звоню

boxplot(test),

У меня получилось так: средние значения 8 переменных очень близки друг к другу. Что очень затрудняет сравнение и интерпретацию. Могу ли я включить все выбросы в свой график? Тогда было бы легче сравнить весь диапазон? Или можно дать какие-либо другие предложения, чтобы различать эти переменные?


person GeekCat    schedule 14.03.2014    source источник
comment
Трудно понять, что именно вы спрашиваете. Блочные диаграммы по умолчанию отображают выбросы, так чего же вам не хватает? Какие переменные вы пытаетесь сравнить?   -  person Stephan Kolassa    schedule 15.03.2014
comment
У меня недостаточно репутации, чтобы опубликовать изображение, но переменные одинаковы, взятые из разных симуляций с разными параметрами, могу ли я просто включить все выбросы? Я не знаю, как изменить значение по умолчанию.   -  person GeekCat    schedule 15.03.2014
comment
Извините, но это не особо помогает делу. boxplot() уже нанесет все ваши выбросы, так в чем же проблема? И как вы хотите сравнить ваши переменные?   -  person Stephan Kolassa    schedule 15.03.2014
comment
drive.google.com/file/d/0B1HubY3HsuxaeHZHRi1Ud0V4dm8/ @StephanKolassa Не могли бы вы взглянуть на картинку по ссылке? Вы поймете проблему, как сравнить и интерпретировать 8 переменных?   -  person GeekCat    schedule 15.03.2014
comment
Сюжет сломан, можно перезалить?   -  person Stephan Kolassa    schedule 15.03.2014
comment
drive.google.com/file/d/0B1HubY3HsuxaeHZHRi1Ud0V4dm8/ @StephanKolassa Ты это видишь? Он есть на гугл диске.   -  person GeekCat    schedule 15.03.2014


Ответы (1)


Вот рассматриваемый блок-график (поскольку у ОП нет представителя для публикации изображений): boxplots

Похоже, что медианы (и, вероятно, также средние значения) в значительной степени идентичны, но дисперсии различаются между восемью категориями, при этом у категории 1 самая низкая, а у 8 самая высокая дисперсия. В зависимости от реального вопроса, этих двух частей информации (одинаковая медиана/среднее значение, разная дисперсия) может быть уже достаточно.

Если вам нужен формальный тест значимости, равны ли дисперсии, вы можете использовать Hartley или тест Бартлетта. Если вы хотите формально проверить равенство средних с неравными дисперсиями (поэтому ANOVA не подходит), посмотрите здесь .

person Stephan Kolassa    schedule 14.03.2014
comment
Kplassa, спасибо за ответ, но вы видите выбросы? Может ли ящичковая диаграмма включать все выбросы? тогда среднее значение и медиана, возможно, будут разными? - person GeekCat; 15.03.2014
comment
О, кажется, я начинаю понимать, что вы имеете в виду. Вы хотите, чтобы ящики расширяли весь диапазон ваших данных? Вы можете сделать это, используя rect(), с параметрами ybottom и ytop, установленными на минимум и максимум каждого столбца, вместо boxplot(), добавив горизонтальный lines() для медианы. Но я не вижу, как это может быть полезнее, чем коробочные диаграммы. И, конечно же, среднее значение и медиана не изменятся, если вы только построите свои данные по-другому. - person Stephan Kolassa; 15.03.2014