двухминутный совет

Что это

Фрейм данных - это структура данных, в которой хранятся данные, чтобы вы могли их анализировать. Такая структура нужна нам для доступа и управления значениями данных, имеющими отношение к нашему анализу.

Во фрейме данных каждый столбец представляет атрибут данных, а каждая строка представляет набор точек данных, составляющих наблюдение. Это станет более понятным в приведенном ниже примере.

Для чего это хорошо

Фрейм данных позволяет вам создать то, что по сути является таблицей, поэтому вы можете проводить анализ в R.

Допустим, вы собираете академические данные для студентов. Для каждого студента у вас есть промежуточный балл, балл за проект и итоговый балл за экзамен. Эти три части информации будут тремя столбцами во фрейме данных.

Вы можете использовать эту информацию для оценки гипотезы о том, что промежуточный балл студента и оценка за проект положительно связаны с его итоговой оценкой на экзамене, то есть более высокие баллы по первым двум атрибутам коррелируют с более высоким итоговым баллом на экзамене.

Вот как будет выглядеть таблица данных на бумаге:

промежуточная оценка, оценка проекта, итоговая оценка экзамена
92, 88, 95
98, 76, 82
79, 84, 91
87, 90 , 95
94, 90, 97

Как создать фрейм данных

Примечание: в R вы часто видите стрелку ‹-, где вы привыкли видеть знак равенства. ‹- и = не совсем одно и то же, но в основном они одинаковы. Когда вы создаете фрейм данных в R, вы можете использовать ‹- или =.

Теперь, когда мы создали фрейм данных на R, давайте проверим его.