Вопросы по теме 'fuzzyjoin'

Передача аргументов в несколько функций match_fun в R fuzzyjoin :: fuzzy_join
Я отвечал на эти два вопроса и получил адекватное решение, но у меня возникли проблемы с передачей аргументов с использованием fuzzy_join в match_fun, который я извлек из fuzzyjoin::stringdist_join . В этом случае я использую сочетание...
3765 просмотров

Ошибка в rsqlite_send_query (conn @ ptr, statement): повторяющееся имя столбца: Ret
У меня есть куча sql-запросов, которые работали нормально, но теперь по какой-то причине больше не работают. Данные не изменились. Код не изменился. Я все время получаю это сообщение об ошибке: Ошибка в rsqlite_send_query (conn @ ptr,...
3222 просмотров
schedule 10.04.2022

Объединить кадры данных по временному интервалу в R
У меня есть два фрейма данных. Один - это фрейм данных отслеживания взгляда с предметом, условием, отметкой времени, положением по оси x и положением по оси y. В нем более 400 000 строк. Вот набор данных игрушки для примера: subid condition...
1493 просмотров
schedule 17.05.2022

Как сделать нечеткое соединение в R, используя более одной переменной с каждой стороны
Я хотел бы присоединиться к двум кадрам данных: a <- data.frame(x=c(1,3,5)) b <- data.frame(start=c(0,4),end=c(2,6),y=c("a","b")) с условием типа (x>start)&(x<end) , чтобы получить такой результат: # x y #1 1 a #2...
1639 просмотров
schedule 21.02.2023

R: нечеткое соединение между двумя наборами данных
Мне нужно нечеткое совпадение и получить расстояние между почтовым индексом / адресом в двух разных наборах данных. Вот пример: name_a <- c("Aldo", "Andrea", "Alberto", "Antonio", "Angelo") name_b <- c("Sara", "Serena", "Silvia", "Sonia",...
519 просмотров
schedule 13.05.2022

Присоединить значение к существующей таблице data.table без точного совпадения (совпадение в пределах интервала)
У меня есть столбец в таблице данных (DT1) , который является убывающим числом (скажем pol_count ), и еще один столбец для среднего возраста населения (скажем AverageAge ). Я пытаюсь взять свое значение pol_count (скажем, 400) и мое значение...
30 просмотров
schedule 24.04.2023

Ограничение вычислений нечетких соединений
Я пытаюсь провести исследование событий, которое оценивает, участвует ли конкретный человек в конкретном событии (событие P) после прохождения определенного лечения (лечение E). Я делаю это, беря наблюдения за событием E и пытаясь объединить их с...
27 просмотров
schedule 26.04.2023

R: Как связать фрейм данных в списке по именам совпадений столбцов? или частичным левым соединением?
моя проблема: У меня есть список с 8 фреймами данных с разными именами столбцов и похожими именами, поэтому я хочу связать эти фреймы данных по совпадению столбцов. Например, в этом случае Мне нужно выровнять строки столбцов Yd; Yc; Yb; Ya....
55 просмотров
schedule 05.07.2023

Вес Fuzzyjoin/stringdist_join для несоответствия заглавных букв (регистр) (stringdist)
Работая с R, я ищу способы взвешивания регистра (т. е. верхний или нижний регистр) в string_dist_left_join() Вот воспроизводимый пример: library(tidyverse) library(fuzzyjoin) tibble1 <- tibble(words = c("Bedford",...
33 просмотров
schedule 12.11.2022

Использование stringdist_left_join для соединения нескольких столбцов, но не всех из них нечетких
У меня есть набор данных публикаций из 1,3 миллиона строк, и для каждой записи я хочу получить paper_id из второго набора данных с 8,6 миллионами строк. Идея состоит в том, чтобы использовать несколько столбцов из обеих таблиц для поиска совпадений...
60 просмотров
schedule 26.09.2022