Публикации по теме 'tidyverse'
Начните с машинного обучения
ВИДЕО
Начните с машинного обучения
Вы заинтересованы в том, чтобы воспользоваться чудесами машинного обучения, но вас пугает сама технология? Не бойся! Машинное обучение с помощью R, tidyverse и mlr уже здесь! Если вы хотите воспользоваться преимуществами машинного обучения, но не знаете, с чего начать, эта книга для вас.
Машинное обучение с помощью R, tidyverse и mlr предлагает практический повседневный подход к обучению машинному обучению. Эта книга посвящена языку R и..
Рекламные ролики Суперкубка
Миллионы зрителей, которые из года в год настраиваются на большую игру, я хотел знать о них все… конечно, анализируя и классифицируя. Я углубился в определяющие характеристики рекламы Суперкубка, а затем сгруппировал рекламные ролики. Данные на этой неделе поступают из FiveThirtyEight .
youtube <- readr :: read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-03-02/youtube.csv')
# data wrangling
youtube <- youtube %>%..
Вопросы по теме 'tidyverse'
тиббл со столбцами списка: преобразовать в массив, если возможно
У меня есть следующий совет:
uuu <- structure(list(IsCharacter = c("a", "b"),
ShouldBeCharacter = list("One", "Another"),
IsList = list("Element1", c("Element2", "Element3"))
),...
4110 просмотров
schedule
11.07.2022
R: объединить два фрейма данных через символьный столбец с небольшими орфографическими ошибками.
Мои два фрейма данных имеют один и тот же столбец символов. Было бы легко объединить их по этому столбцу с помощью dplyr :: full_joint. Но проблема в том, что общий столбец имеет небольшие, но очевидные различия в написании. Различия в написании...
1458 просмотров
schedule
10.11.2022
Заполните и заполните недостающие данные в группах, используя другой фрейм данных
Как я могу заполнить пропущенные значения по группам?
У меня есть df с рекомендациями и рангами, и мне нужно вставить рекомендации по умолчанию, когда у меня их нет как минимум 4.
Пример ввода:
library(tidyverse)
fixed_recomendations <-...
58 просмотров
schedule
09.09.2022
Удалите строки, где все переменные являются NA, используя dplyr
У меня возникли проблемы с, казалось бы, простой задачей: удалить все строки, где все переменные NA , с помощью dplyr. Я знаю, что это можно сделать, используя базовый R ( Удалить строки в матрице R, где все данные - NA и Удаление пустые...
23679 просмотров
schedule
12.06.2022
R: Ошибка при запуске кода примера для reduce () из пакета purr
Я хочу использовать reduce () для попарного объединения переменного количества столбцов из фрейма данных. Похоже, что reduce () выполнит эту работу, поэтому я попробовал несколько примеров кода и получил эту ошибку. Я использую RStudio, версия...
224 просмотров
schedule
02.08.2023
Сокращайте списки путем поэлементного суммирования в мурлыкании
Я пытаюсь использовать purrr для суммирования элементов списка с тем же индексом. Это может быть достигнуто в базе R, используя следующее:
xx <- list(a = c(1,2,3,4,5), b = c(1,2,3,4,5))
Reduce("+", xx)
которая обеспечивает:
[1] 2...
779 просмотров
schedule
21.10.2022
Удаление стоп-слов с помощью tidytext
Используя tidytext, у меня есть этот код:
data(stop_words)
tidy_documents <- tidy_documents %>%
anti_join(stop_words)
Я хочу, чтобы он использовал стоп-слова, встроенные в пакет, для записи фрейма данных tidy_documents в фрейм...
13147 просмотров
schedule
19.04.2022
Как добавить текст в заголовок в ggplot на основе значения, предоставленного аккуратным data.frame
У меня есть следующий фрейм данных:
df <- structure(list(some_score = c(0.159908755191963, 0.191316882518594, 0.505115802144402,
0.137543374720433, 0.00611518542460786, 0.17817657028984, 0.184484678282946,
0.389765901467282,...
1352 просмотров
schedule
16.12.2023
base R быстрее, чем readr, для чтения нескольких файлов CSV
Существует множество документации о том, как читать несколько CSV и связывать их в один фрейм данных. У меня есть более 5000 файлов CSV, которые мне нужно прочитать и привязать к одной структуре данных.
В частности, я следил за обсуждением здесь:...
1298 просмотров
schedule
01.11.2022
Преобразование эпох с использованием негригорианских календарей
Я работаю с набором выходных данных климатической модели (в частности, модели CMIP5 ). Это netcdfs температуры, ветра и т. д. с отметками времени.
Все они используют соглашение days since YYYY-mm-dd 00:00:00 в UTC. Я преобразовывал в более...
55 просмотров
schedule
13.03.2023
Комбинируйте легенды на карте, когда данные указаны в геометрии
Я использую ggplot2 для построения карты и точек поверх нее. Это состоит из построения карты и последующего использования geom_point() для размещения точек. Кроме того, эти точки различаются по размеру в зависимости от другой переменной. Когда...
406 просмотров
schedule
22.06.2023
Функция аранжировки в dplyr 0.7.1
Я пытаюсь использовать новую функциональность quo при написании функции, использующей dplyr, и столкнулся со следующей проблемой:
df <- tibble(
g1 = c(1, 1, 2, 2, 2),
g2 = c(1, 2, 1, 3, 1),
a = sample(5),
b = sample(5)
)...
992 просмотров
schedule
22.12.2022
Превратите сложные беспорядочные данные в длинный формат данных в R
Я мог бы просто сделать это вручную, создав массивы, переставив их и объединив, или, может быть, с помощью base::reshape . Тем не менее, я хотел бы перейти к истине в последней инстанции, прыгнув замертво в Тидивселенную, но теперь я тону.
У меня...
139 просмотров
schedule
07.05.2022
Как аккуратно изменить порядок уровней факторов?
Привет, я обычно использую следующий код, чтобы изменить порядок полос в ggplot или других типах графиков.
Обычный график (неупорядоченный)
library(tidyverse)
iris.tr <-iris %>% group_by(Species) %>% mutate(mSW = mean(Sepal.Width))...
28021 просмотров
schedule
15.05.2023
Вычислить столбец процентов для списка фреймов данных, когда итоговое значение скрыто в строках
library(tidyverse)
Я чувствую, что для этого есть простое решение, но я застрял. Приведенный ниже код создает простой список из двух фреймов данных (они одинаковы для простоты примера, но реальные данные имеют разные значения)...
96 просмотров
schedule
24.05.2023
Подсчет записей с несколькими вариантами выбора в одном столбце в кадре данных R программно
Данные опроса часто содержат столбцы с несколькими вариантами ответов, записи которых разделены запятыми, например:
library("tidyverse")
my_survey <- tibble(
id = 1:5,
question.1 = 1:5,
question.2 = c("Bus", "Bus, Walk, Cycle", "Cycle",...
398 просмотров
schedule
24.05.2023
Как установить Tidyverse на Ubuntu 16.04 и 17.04
Я использую Ubuntu 16.04 [сейчас 17.04: см. Примечание, выделенное жирным шрифтом ниже] и R 3.4.1. Я установил последнюю сегодня утром, так что предполагаю, что это последняя версия. Я хочу установить Tidyverse, с которым я провел много счастливых...
10272 просмотров
schedule
22.02.2024
Как указать несколько столбцов с помощью функции gather () для упорядочивания данных
Я хочу привести свои данные в порядок с помощью функции сбора, но как указать сразу несколько столбцов?
Скажите, что это мои данные:
Country Country.Code Year X0tot4 X5tot9 X10tot14 X15tot19 X20tot24
1 Viet Nam 704 1955 4606...
11184 просмотров
schedule
02.04.2023
Создайте переменную пропорций, зависящую от уровня фактора, из подмножеств данных, используя tidyverse.
У меня есть такой кадр данных:
df<- data.frame(year= as.character(c("1997",
"1997","1997","1997","1997","1997","1998","1998")),season=
as.character(c("W", "W","W","D","D","D","W","W")),result=
as.character(c("Y",...
149 просмотров
schedule
29.01.2023
Получение имени столбца в качестве дополнительного аргумента для работы в аккуратном конвейере mutate_all
Я хочу использовать имя столбца внутри функции без явного указания его в качестве аргумента этой функции, вызываемой в аккуратном ( dplyr , tidyr , purrr , ...) канале. Это потому, что я хотел бы использовать эту функцию для многих столбцов...
161 просмотров
schedule
08.09.2022