Это третье введение в R. Здесь будут рассмотрены основы фрейма данных, индексация и выбор фрейма данных, операции и многое другое.

*Первоначально опубликовано в моем подстеке. Это лишь часть статьи.

PS: пожалуйста, прочтите «Введение в R для науки о данных (часть вторая)», прежде чем читать это. Это продолжение второй части.

Часть вторая: Введение в R для науки о данных (часть вторая)

Фреймы данных

Мы сможем организовывать и смешивать типы данных для создания структур данных с помощью фреймов данных.

Некоторые встроенные фреймы данных (введите их в консоль):

  • состояние.x77
  • СШАЛичные расходы
  • женщины
  • МирТелефоны

Если вы хотите, чтобы все кадры данных, доступные в R, использовали:

  • данные()

Если вы хотите заглянуть в верхний или нижний фрейм данных, используйте:

  • голова (состояние.x77)

Это покажет первые шесть строк (по умолчанию).

  • голова (состояние.x77, 9)

Это покажет первые девять строк. Вы можете изменить его, чтобы показать, сколько строк вы хотите. Если вы хотите увидеть одиннадцать строк, измените его на head(state.x77,11). Если вы хотите увидеть четыре строки, измените их на head(state.x77,4). Вы поняли идею.

  • хвост(состояние.x77)

Это покажет последние шесть строк.

PS: Не обращайте внимания на ошибку, я случайно поставил точку вместо запятой.

Вы можете создавать свои собственные фреймы данных, используя функцию data.frame.

str(dda) предоставит информацию о структуре данных во фрейме данных.

summary(dda) даст нам сводку по каждому из столбцов в нашем фрейме данных. Таким образом, мы получаем минимальные, медианные, средние, квартильные значения и максимальные значения.

Индексация и выбор фреймов данных

Вот как мы собираемся извлекать данные из нашего фрейма данных.

Мы можем использовать dda[1,] для возврата первой строки.

Мы можем использовать dda[,1] для получения всех столбцов из первой строки.

Мы можем использовать dda[,’rain’] для получения всех значений дождя.

Мы можем использовать dda[1:5,c(‘days’,’temps’)] для получения всех строк, но только значений дней и temps.

Мы можем использовать dda$days, чтобы получить все значения дней.

Мы можем сделать это с помощью temps (dda$temps), и он покажет все значения для temps.

Мы можем использовать dda[‘days’] для получения всех дней, но разница между этим и dda$days в том, что он возвращает его в формате фрейма данных. Если я использую знак доллара, я получу вектор.

Мы можем использовать функцию подмножества (подмножество ()), чтобы получить подмножество значений из наших данных. В этом случае мы хотим вернуть истинные дожди.

Я также использовал сабы

Полный текст статьи читайте здесь: https://ivanh.substack.com/p/introduction-to-r-for-machine-learning-d3a