Вопросы по теме 'plyr'

Как я могу структурировать и перекодировать беспорядочные категориальные данные в R?
Я пытаюсь понять, как наилучшим образом структурировать беспорядочные категориальные данные, поступающие из набора данных Мне нужно почистить. Схема кодирования Я анализирую данные университетского экзамена по естественным наукам. Мы изучаем...
922 просмотров
schedule 03.05.2023

plyr в R очень медленный во время слияния
Я использую пакет plyr в R, чтобы сделать следующее: подобрать строку из таблицы A по столбцу A и столбцу B найти строку из таблицы B, имеющую одинаковое значение в столбце A и столбце B скопировать столбец C из таблицы B в таблицу A Я...
478 просмотров
schedule 25.12.2022

Как ускорить суммирование и ddply?
У меня есть фрейм данных с 2 миллионами строк и 15 столбцами. Я хочу сгруппировать по 3 из этих столбцов с помощью ddply (все 3 являются факторами, и существует 780 000 уникальных комбинаций этих факторов) и получить средневзвешенное значение из 3...
5655 просмотров
schedule 12.05.2022

Как заставить doSMP хорошо работать с plyr?
Этот код работает: library(plyr) x <- data.frame(V= c("X", "Y", "X", "Y", "Z" ), Z = 1:5) ddply(x, .(V), function(df) sum(df$Z),.parallel=FALSE) Пока этот код не работает: library(doSMP) workers <- startWorkers(2)...
1857 просмотров

r объединение результатов tapply с помощью do.call (rbind) или ddply
У меня есть информация о дате / времени, где я хочу получить средний, минимальный, максимальный, диапазон дат по «сезонам», сгруппированных по годам, и единственный способ, которым я немного преуспел в этом, - это tapply. Самая близкая - это сводная...
1476 просмотров
schedule 21.06.2022

Использование дат с пакетом data.table
Я недавно обнаружил пакет data.table и теперь задавался вопросом, стоит ли мне заменить часть моего plyr-кода. Подводя итог, мне очень нравится plyr, и я в основном добился всего, чего хотел. Тем не менее, мой код работает некоторое время, и мне...
8850 просмотров
schedule 04.05.2023

R, plyr, со сложной функцией
У меня есть следующий набор данных (CEU): group x y 1 -23 100 1 -0.90 69.62 1 -0.90 72.03 2 -23 100 2 0.69 48.01 2 0.69 45.63 Для каждого значения группы я хочу применить функции, указанные...
809 просмотров
schedule 16.04.2022

быстрый/элегантный способ построения сводной таблицы среднего/дисперсии
Я могу выполнить эту задачу, но я чувствую, что должен быть «лучший» (самый гладкий, самый компактный, самый понятный код, самый быстрый?) способ сделать это, и до сих пор не понял... Для указанного набора категориальных факторов я хочу построить...
14916 просмотров
schedule 14.02.2023

Группируйте по нескольким столбцам и суммируйте другие несколько столбцов
У меня есть фрейм данных с примерно 200 столбцами, из них я хочу сгруппировать таблицу по первым 10 или около того, которые являются факторами, и суммировать остальные столбцы. У меня есть список всех имен столбцов, по которым я хочу сгруппировать,...
78804 просмотров
schedule 27.12.2022

Цикл SQL для чтения, затем запись данных в файл
У меня есть набор данных с 57 миллионами строк и 23 столбцами. Есть столбец с названиями видов разных птиц (около 2000 уникальных названий), и я хотел бы вытащить два столбца данных (широта, долгота) для каждого уникального названия вида и записать в...
2671 просмотров
schedule 17.02.2024

сравнение двух целых чисел в R: более длинная длина объекта не кратна более короткой длине объекта ddply
Я получаю предупреждение «более длинная длина объекта, не кратная более короткой длине объекта» в R при сравнении двух целых чисел для подмножества кадра данных посреди определяемой пользователем функции. Пользовательская функция просто возвращает...
866 просмотров
schedule 13.06.2023

Могу ли я комбинировать столбцы и функции на столбцах с помощью plyr?
Я не знаю, почему этот код, который пытается сгруппировать события на основе идентификатора и с большей степенью детализации, терпит неудачу при использовании библиотеки plyr: times <- as.POSIXct("1970-01-01")+1:100 vals <-...
140 просмотров
schedule 18.02.2023

Почему интерфейсы plyr с отклоненными результатами несовместимы с% foreach%?
Я пишу сценарий на основе plyr для чтения ввода из файлов, расположенных в разных каталогах, обработки этого ввода, а затем записи вывода в другое место. Поскольку у меня много входных данных, имеет смысл использовать doMC с d_ply , но я был...
205 просмотров
schedule 11.03.2023

Выбор определенных строк на основе значений в 2 столбцах в R
У меня есть большой набор данных о местоположениях GPS-ошейников, которые каждый день имеют разное количество местоположений. Я хочу выделить только те дни, в которые собрано одно местоположение, и создать новый фрейм данных, содержащий всю их...
5848 просмотров
schedule 21.12.2023

Объединение частотных таблиц в единый фрейм данных
У меня есть список, в котором каждый элемент списка представляет собой таблицу частоты слов, полученную в результате использования «таблицы ()» в другом образце текста. Таким образом, каждая таблица имеет разную длину. Теперь я хочу преобразовать...
3433 просмотров
schedule 16.05.2023

задержка ddply с несколькими подмножествами
Я считаю, что ddply — это инструмент, который мне нужен для моей задачи, и у меня есть некоторые трудности с получением правильных результатов. Я несколько часов читал о ddply и экспериментировал с разными кодами, но сам ничего не продвинулся. вот...
1283 просмотров
schedule 29.03.2023

Интерполируйте данные, используя plyr в R
Я пытаюсь использовать plyr и приблизительно для интерполяции значений y для каждого года между наблюдаемыми значениями. Вместо 3 наблюдений для каждой страны, Я хотел бы иметь 11 наблюдений — по одному на каждый год с 1985 по 1995 год. Вот...
4059 просмотров
schedule 23.08.2022

Выборка небольшого фрейма данных из большого фрейма данных
Я пытаюсь сделать выборку кадра данных из данного кадра данных, чтобы было достаточно выборок с каждого из уровней переменной. Этого можно достичь, разделив фрейм данных по уровням и выборке из каждого из них. Я думал, что ddply (от фрейма данных...
2841 просмотров
schedule 09.02.2023

Вычисление среднечасовых значений из многолетнего временного ряда
У меня есть набор данных, заполненный средней скоростью ветра в час за несколько лет. Я хотел бы создать «средний год», в котором для каждого часа рассчитывается средняя скорость ветра для этого часа за несколько лет. Как я могу сделать это без...
1924 просмотров
schedule 16.11.2022

как назначить уникальный идентификатор нескольким записям фрейма данных
У меня есть большой фрейм данных с тремя идентификаторами. Например: df <- data.frame(year=c(1999,1999,2000,2000,2000), country=c('K','K','M','M','S'), site=c('di','se','di','di','di')) Это создаст такой фрейм данных:...
3184 просмотров
schedule 20.11.2022