Вопросы по теме 'openrefine'

Google-уточнить/добавить столбец из Freebase: ограничение, похоже, не работает
У меня есть колонка Towns, которую я сверил с Freebase. Теперь я хочу создать новый столбец из Freebase с населением. Я добавляю столбец «Население » количество» с ограничением {"год>":"2006", "год‹":"2012", "сортировка":"-год", "лимит":1 }...
228 просмотров
schedule 15.05.2022

Google Refine: можно ли использовать переменную в регулярном выражении?
Я пытаюсь сделать что-то подобное в Open/Google Refine: forEach(["foo", "bar"], regex, value.match(/.*(regex).*/)) Это зацикливает массив ключевых слов, чтобы проверить, содержит ли ячейка какое-либо из них. Как я могу использовать эти...
96 просмотров
schedule 31.03.2024

добавление нового столбца из существующего столбца с использованием регулярного выражения
Я пытаюсь извлечь количество подписчиков из данных ниже: Я пробовал это: Приведенный выше код должен извлекать 294, но вновь созданный столбец содержит нулевое значение. Что-то не так в моем регулярном выражении?...
78 просмотров
schedule 18.01.2023

Добавление двух файлов в Open Refine и Drilling down через два столбца
У меня два вопроса по Open Refine У меня есть несколько наборов данных в виде файлов Excel, но я хочу загрузить их все в Open Refine. Как добавить файл A, файл B и файл C в Open Refine? Все файлы имеют одинаковые имена столбцов. Обратите...
1188 просмотров
schedule 20.05.2024

Можно ли добавить столбец на основе ключевых слов в существующий столбец?
В общем, вот что я пытаюсь сделать: проанализировать строку в одной ячейке электронной таблицы, а затем добавить ключевые слова в другую ячейку в этой строке, если в проанализированной ячейке обнаружены определенные ключевые слова. Я использую...
662 просмотров
schedule 10.04.2023

Сложный TSV в XML с использованием XSLT
Это дополнительный вопрос к предыдущему сообщению . Я работаю с набором записей библиотечного каталога (в формате MARC XML ), который я хочу очистить и улучшить с помощью инструмента под названием OpenRefine . OpenRefine не очень хорошо работает...
425 просмотров
schedule 24.05.2023

Дополнительный пробел между словами
Пожалуйста, помогите мне с двумя вопросами о том, как сделать выражение GREL для: Если между двумя словами в столбце есть двойные пробелы, как я могу удалить 1 пробел Пример: Robert--Smith to Robert-Smith Знак минус равен пробелу для иллюстрации...
1200 просмотров
schedule 18.09.2022

Как я могу объединить два набора данных с помощью ключа в OpenRefine, когда вторичная таблица имеет более одного значения?
У меня есть такой набор данных X: Code | Name ------------ 123 | AAA 456 | BBB А другой Y такой: Code | Level ------------ 123 | A 123 | B 456 | B 456 | C Я хочу присоединиться к ним с помощью OpenRefine примерно так: Code...
744 просмотров
schedule 01.05.2022

OpenRefine текстовое преобразование unique () без учета регистра
Есть ли способ указать uniques () игнорировать регистр? У меня есть GREL, который работает как forEach(value.split(","),v,v.trim()).uniques().join(",") Он берет каждое значение в ячейке, разделенное запятыми, а затем...
236 просмотров
schedule 28.02.2024

Лучший способ разобрать большой и сложный файл Json с помощью OpenRefine (или R)
Я знаю, как анализировать json-ячейки в Open Refine, но это слишком сложно для меня. Я использовал API для извлечения календаря 4730 комнат AirBNB, идентифицированных по их идентификаторам. Вот пример одного файла Json:...
1398 просмотров
schedule 20.02.2023

OpenRefine JSON для очистки CSV в R?
В этом здесь но я хочу сделать то же самое полностью в R. Я хочу внести изменения в OpenRefine JSON в CSV в R. Я пробовал решение в jsonlite, но еще не удовлетворен, очень грязно анализировать изменения JSON и применять их к любому CSV....
130 просмотров
schedule 24.02.2023

OpenRefine: заполнить с увеличивающимся счетчиком
Возможно ли в OpenRefine заполнить пустые ячейки счетчиком вместо копирования верхнего непустого значения? В этом примере изображения: Или вот тот же пример, что и набранный текст - изобразите это как столбец сверху вниз: 1 1 blank 1...
395 просмотров
schedule 13.04.2022

Извлечение адресов электронной почты из беспорядочного текста в OpenRefine
Я пытаюсь извлечь только электронные письма из текстового столбца в openrefine. в некоторых ячейках указан только адрес электронной почты, а в других - имя и адрес электронной почты в формате john doe <[email protected]> . Я использовал следующее...
531 просмотров
schedule 18.02.2023

Сравнивайте и уточняйте строки в отдельных столбцах с помощью пакета refinr.
Много времени я трачу на объединение двух фреймов данных по стране, муниципалитету, названию или столбцу партии. Теперь это refinr пакет , Порт R в OpenRefine, это удобно. Только я еще не понял, как сравнить два «одинаковых» столбца и назвать...
309 просмотров
schedule 09.07.2023

Как использовать оператор or в операторе if в openrefine
Мне нужно проверить 2 значения внутри условия if в Openrefine, которое я уже пробовал: if(value > 5.6 | < -33, "inside", "outside") if(value > 5.6 || < -33, "inside", "outside") if(value > 5.6 or < -33, "inside", "outside")
2089 просмотров
schedule 14.08.2022

Excel / XLS - фильтруйте данные (с помощью регулярного выражения) и преобразуйте их в новые ячейки (возможно с openrefine?)
У меня проблема. Я не специалист по Excel. Я нашел несколько тем, как использовать регулярное выражение в Excel, например: Как использовать Regular Выражения (Regex) в Microsoft Excel внутри ячейки и циклы Но я не знаю, как...
2670 просмотров
schedule 08.11.2023

Openrefine — согласование по второму или третьему кандидату
Со службой согласования я часто сталкиваюсь с этой проблемой: лучший кандидат не совсем правильный, лучшим является второй или третий кандидат (объявление, у которого также есть лучший результат), например: Как правильно выбрать по массе? У...
83 просмотров
schedule 23.01.2024

Как объединить строки в Open Refine
Я новичок в открытом уточнении, и я пытаюсь объединить строки и столбцы в электронной таблице с множеством повторяющихся значений. Пожалуйста, найдите пример, который я ищу ниже. Я думаю, что это связано с командой «заполнить», но я не уверен....
979 просмотров
schedule 06.08.2022

Использование OpenRefine для создания таблицы сопоставления из двух других таблиц
У меня есть следующий вариант использования, для решения которого, похоже, подходит OpenRefine. В моей базе данных есть "грязная" таблица продуктов, которая выглядит следующим образом: id name 51 Product A 52 product-a 53 product B 54...
267 просмотров
schedule 06.10.2023

Как сравнить ячейки из разных строк в одном проекте в OpenRefine
У меня есть набор данных со столбцом с именем START , содержащим значения даты. Есть ли способ сравнить START значение строки со всеми другими START значениями внутри проекта? Я хочу создать новый столбец с таким сообщением "Rows n°...
262 просмотров
schedule 29.12.2022