R — это язык программирования, который часто используется для статистического анализа и обработки данных. Одним из важных аспектов работы с данными в R является понимание различных доступных типов данных. В этой статье мы обсудим различные типы данных в R и приведем примеры того, как с ними работать.

Атомные векторы (векторы)

Атомарные векторы являются самым основным типом данных в R. Они могут содержать элементы одного типа, такие как числовые, символьные или логические значения.

Вот несколько примеров атомарных векторов в R:

# Numeric vector
x <- c(1, 2, 3, 4)

# Character vector
y <- c("apple", "banana", "cherry")

# Logical vector
z <- c(TRUE, FALSE, TRUE, FALSE)

Вы можете получить доступ к отдельным элементам атомарного вектора с помощью индексации. Например, чтобы получить доступ ко второму элементу вектора x, вы должны использовать x[2]. Вы также можете получить доступ к ряду элементов с помощью оператора :. Например, x[2:4] вернет второй, третий и четвертый элементы вектора x.

Списки

Списки — еще один распространенный тип данных в R. Они могут содержать элементы разных типов, включая другие списки. Списки создаются с помощью функции list().

Вот пример списка в R:

my_list <- list(1, "apple", c(2, 3, 4), TRUE)

Вы можете получить доступ к элементам списка с помощью индексации, как и с атомарными векторами. Например, чтобы получить доступ ко второму элементу списка my_list, вы должны использовать my_list[[2]].

Факторы

Факторы используются для представления категориальных данных в R. Они создаются с помощью функции factor().

Вот пример создания фактора в R:

x <- c("apple", "banana", "cherry", "apple", "banana")
y <- factor(x)

В этом примере вектор x содержит символьные значения, представляющие названия фруктов. Функция factor() преобразует эти значения в фактор, представляющий собой особый тип вектора, который может содержать только ограниченный набор значений.

Вы можете получить доступ к уровням фактора, используя функцию levels(). Например, levels(y) вернет вектор символов, содержащий уровни «яблоко», «банан» и «вишня».

Фреймы данных

Фреймы данных — это распространенный тип данных в R, который используется для хранения табличных данных. Они похожи на списки, но каждый элемент должен иметь одинаковую длину. Фреймы данных создаются с помощью функции data.frame().

Вот пример создания фрейма данных в R:

name <- c("Alice", "Bob", "Charlie")
age <- c(25, 30, 35)
gender <- c("Female", "Male", "Male")

df <- data.frame(name, age, gender)

В этом примере фрейм данных df имеет три столбца: name, age и gender. Вы можете получить доступ к отдельным столбцам фрейма данных с помощью оператора $. Например, df$age вернет вектор, содержащий значения возраста для каждой строки во фрейме данных.

Матрицы

Матрицы — это еще один тип данных в R, который используется для хранения табличных данных, но они должны иметь одинаковый тип данных и одинаковое количество строк и столбцов. Матрицы создаются с помощью функции matrix().

Вот пример создания матрицы в R:

x <- c(1, 2, 3, 4, 5, 6)
y <- matrix(x, nrow = 2, ncol = 3)

В этом примере матрица y имеет две строки и три столбца и содержит значения 1, 2, 3, 4, 5 и 6. Вы можете получить доступ к элементам матрицы с помощью индексации, как и с атомарными векторами. Например, y[1,2] вернет элемент в первой строке и втором столбце матрицы.

Массивы

Массивы похожи на матрицы, но могут иметь более двух измерений. Они создаются с помощью функции array().

Вот пример создания массива в R:

x <- 1:24
y <- array(x, dim = c(2, 3, 4))

В этом примере массив y имеет три измерения с размерами 2, 3 и 4. Вы можете получить доступ к элементам массива с помощью индексации, как и в случае с матрицами. Например, y[1,2,3] вернет элемент в первом измерении, второй строке и третьем столбце массива.

Другие типы данных

В R есть несколько других типов данных, которые используются реже, но все же заслуживают упоминания. К ним относятся:

  • NULL: представляет пустое значение
  • NA: представляет отсутствующее или неопределенное значение
  • NaN: представляет не числовое значение

Работа с типами данных в R

R имеет несколько функций, которые можно использовать для работы с типами данных. Некоторые распространенные включают:

  • class(x): возвращает класс объекта x
  • mode(x): возвращает режим (тип данных) объекта x
  • as.numeric(x): преобразует объект x в числовой вектор.
  • as.character(x): преобразует объект x в вектор символов

Важно понимать различные типы данных в R и как с ними работать, чтобы эффективно манипулировать данными и анализировать их. Я надеюсь, что эта статья помогла вам познакомиться с различными типами данных в R и предоставить несколько примеров того, как с ними работать.