Публикации по теме 'tidyverse'


Начните с машинного обучения
ВИДЕО Начните с машинного обучения Вы заинтересованы в том, чтобы воспользоваться чудесами машинного обучения, но вас пугает сама технология? Не бойся! Машинное обучение с помощью R, tidyverse и mlr уже здесь! Если вы хотите воспользоваться преимуществами машинного обучения, но не знаете, с чего начать, эта книга для вас. Машинное обучение с помощью R, tidyverse и mlr предлагает практический повседневный подход к обучению машинному обучению. Эта книга посвящена языку R и..

Рекламные ролики Суперкубка
Миллионы зрителей, которые из года в год настраиваются на большую игру, я хотел знать о них все… конечно, анализируя и классифицируя. Я углубился в определяющие характеристики рекламы Суперкубка, а затем сгруппировал рекламные ролики. Данные на этой неделе поступают из FiveThirtyEight . youtube <- readr :: read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-03-02/youtube.csv') # data wrangling youtube <- youtube %>%..

Вопросы по теме 'tidyverse'

тиббл со столбцами списка: преобразовать в массив, если возможно
У меня есть следующий совет: uuu <- structure(list(IsCharacter = c("a", "b"), ShouldBeCharacter = list("One", "Another"), IsList = list("Element1", c("Element2", "Element3")) ),...
4110 просмотров
schedule 11.07.2022

R: объединить два фрейма данных через символьный столбец с небольшими орфографическими ошибками.
Мои два фрейма данных имеют один и тот же столбец символов. Было бы легко объединить их по этому столбцу с помощью dplyr :: full_joint. Но проблема в том, что общий столбец имеет небольшие, но очевидные различия в написании. Различия в написании...
1458 просмотров
schedule 10.11.2022

Заполните и заполните недостающие данные в группах, используя другой фрейм данных
Как я могу заполнить пропущенные значения по группам? У меня есть df с рекомендациями и рангами, и мне нужно вставить рекомендации по умолчанию, когда у меня их нет как минимум 4. Пример ввода: library(tidyverse) fixed_recomendations <-...
58 просмотров
schedule 09.09.2022

Удалите строки, где все переменные являются NA, используя dplyr
У меня возникли проблемы с, казалось бы, простой задачей: удалить все строки, где все переменные NA , с помощью dplyr. Я знаю, что это можно сделать, используя базовый R ( Удалить строки в матрице R, где все данные - NA и Удаление пустые...
23679 просмотров
schedule 12.06.2022

R: Ошибка при запуске кода примера для reduce () из пакета purr
Я хочу использовать reduce () для попарного объединения переменного количества столбцов из фрейма данных. Похоже, что reduce () выполнит эту работу, поэтому я попробовал несколько примеров кода и получил эту ошибку. Я использую RStudio, версия...
224 просмотров
schedule 02.08.2023

Сокращайте списки путем поэлементного суммирования в мурлыкании
Я пытаюсь использовать purrr для суммирования элементов списка с тем же индексом. Это может быть достигнуто в базе R, используя следующее: xx <- list(a = c(1,2,3,4,5), b = c(1,2,3,4,5)) Reduce("+", xx) которая обеспечивает: [1] 2...
779 просмотров
schedule 21.10.2022

Удаление стоп-слов с помощью tidytext
Используя tidytext, у меня есть этот код: data(stop_words) tidy_documents <- tidy_documents %>% anti_join(stop_words) Я хочу, чтобы он использовал стоп-слова, встроенные в пакет, для записи фрейма данных tidy_documents в фрейм...
13147 просмотров
schedule 19.04.2022

Как добавить текст в заголовок в ggplot на основе значения, предоставленного аккуратным data.frame
У меня есть следующий фрейм данных: df <- structure(list(some_score = c(0.159908755191963, 0.191316882518594, 0.505115802144402, 0.137543374720433, 0.00611518542460786, 0.17817657028984, 0.184484678282946, 0.389765901467282,...
1352 просмотров
schedule 16.12.2023

base R быстрее, чем readr, для чтения нескольких файлов CSV
Существует множество документации о том, как читать несколько CSV и связывать их в один фрейм данных. У меня есть более 5000 файлов CSV, которые мне нужно прочитать и привязать к одной структуре данных. В частности, я следил за обсуждением здесь:...
1298 просмотров
schedule 01.11.2022

Преобразование эпох с использованием негригорианских календарей
Я работаю с набором выходных данных климатической модели (в частности, модели CMIP5 ). Это netcdfs температуры, ветра и т. д. с отметками времени. Все они используют соглашение days since YYYY-mm-dd 00:00:00 в UTC. Я преобразовывал в более...
55 просмотров
schedule 13.03.2023

Комбинируйте легенды на карте, когда данные указаны в геометрии
Я использую ggplot2 для построения карты и точек поверх нее. Это состоит из построения карты и последующего использования geom_point() для размещения точек. Кроме того, эти точки различаются по размеру в зависимости от другой переменной. Когда...
406 просмотров
schedule 22.06.2023

Функция аранжировки в dplyr 0.7.1
Я пытаюсь использовать новую функциональность quo при написании функции, использующей dplyr, и столкнулся со следующей проблемой: df <- tibble( g1 = c(1, 1, 2, 2, 2), g2 = c(1, 2, 1, 3, 1), a = sample(5), b = sample(5) )...
992 просмотров
schedule 22.12.2022

Превратите сложные беспорядочные данные в длинный формат данных в R
Я мог бы просто сделать это вручную, создав массивы, переставив их и объединив, или, может быть, с помощью base::reshape . Тем не менее, я хотел бы перейти к истине в последней инстанции, прыгнув замертво в Тидивселенную, но теперь я тону. У меня...
139 просмотров
schedule 07.05.2022

Как аккуратно изменить порядок уровней факторов?
Привет, я обычно использую следующий код, чтобы изменить порядок полос в ggplot или других типах графиков. Обычный график (неупорядоченный) library(tidyverse) iris.tr <-iris %>% group_by(Species) %>% mutate(mSW = mean(Sepal.Width))...
28021 просмотров
schedule 15.05.2023

Вычислить столбец процентов для списка фреймов данных, когда итоговое значение скрыто в строках
library(tidyverse) Я чувствую, что для этого есть простое решение, но я застрял. Приведенный ниже код создает простой список из двух фреймов данных (они одинаковы для простоты примера, но реальные данные имеют разные значения)...
96 просмотров
schedule 24.05.2023

Подсчет записей с несколькими вариантами выбора в одном столбце в кадре данных R программно
Данные опроса часто содержат столбцы с несколькими вариантами ответов, записи которых разделены запятыми, например: library("tidyverse") my_survey <- tibble( id = 1:5, question.1 = 1:5, question.2 = c("Bus", "Bus, Walk, Cycle", "Cycle",...
398 просмотров
schedule 24.05.2023

Как установить Tidyverse на Ubuntu 16.04 и 17.04
Я использую Ubuntu 16.04 [сейчас 17.04: см. Примечание, выделенное жирным шрифтом ниже] и R 3.4.1. Я установил последнюю сегодня утром, так что предполагаю, что это последняя версия. Я хочу установить Tidyverse, с которым я провел много счастливых...
10272 просмотров
schedule 22.02.2024

Как указать несколько столбцов с помощью функции gather () для упорядочивания данных
Я хочу привести свои данные в порядок с помощью функции сбора, но как указать сразу несколько столбцов? Скажите, что это мои данные: Country Country.Code Year X0tot4 X5tot9 X10tot14 X15tot19 X20tot24 1 Viet Nam 704 1955 4606...
11184 просмотров
schedule 02.04.2023

Создайте переменную пропорций, зависящую от уровня фактора, из подмножеств данных, используя tidyverse.
У меня есть такой кадр данных: df<- data.frame(year= as.character(c("1997", "1997","1997","1997","1997","1997","1998","1998")),season= as.character(c("W", "W","W","D","D","D","W","W")),result= as.character(c("Y",...
149 просмотров
schedule 29.01.2023

Получение имени столбца в качестве дополнительного аргумента для работы в аккуратном конвейере mutate_all
Я хочу использовать имя столбца внутри функции без явного указания его в качестве аргумента этой функции, вызываемой в аккуратном ( dplyr , tidyr , purrr , ...) канале. Это потому, что я хотел бы использовать эту функцию для многих столбцов...
161 просмотров
schedule 08.09.2022