OpenRefine JSON для очистки CSV в R?

В этом здесь но я хочу сделать то же самое полностью в R. Я хочу внести изменения в OpenRefine JSON в CSV в R.

Я пробовал решение в jsonlite, но еще не удовлетворен, очень грязно анализировать изменения JSON и применять их к любому CSV. Возможно, есть парсеры JSON, чтобы упростить процесс. OpenRefine JSON содержит множество различных правок и, возможно, даже код GREPL и Jython/Python, чтобы немного усложнить этот процесс. Так что, возможно, кто-то рассмотрел готовое решение для этого.

Как почистить CSV-файл в соответствии с OpenRefine JSON в R?

Вспомогательные вопросы

  1. Существуют ли какие-то пакеты только для этого, например, поиск всех значений полей from даже в подсписках JSON?

  2. Существует ли готовый пакет для этого?

  3. Существуют такие поля, как to, from, и для всех видов редактирования у вас есть новые операции редактирования. Какие пакеты R идеально подходят для этого?


person hhh    schedule 31.07.2017    source источник
comment
Может быть, просто использовать пакет CRAN rrefine для доступа R к Open Refine?   -  person Dirk Eddelbuettel    schedule 01.08.2017
comment
Я заинтересован. Я часто запускаю проект в OpenRefine, а затем воспроизводю его в R или Python/Pandas, используя ряд пользовательских функций. Автоматический переводчик был бы очень полезен. Но это не тривиальная проблема.   -  person Ettore Rizza    schedule 01.08.2017
comment
Пакет @DirkEddelbuettel rrefine предполагает, что сервер OpenRefine включен, в то время как этот вопрос не предполагает этого.   -  person hhh    schedule 01.08.2017
comment
@Ettore Rizza github.com/OpenRefine/OpenRefine/issues/1220, если OpenRefine выполнен модульно, мы должны найти готовую функцию Java, которую мы могли бы использовать из ее репозитория.   -  person hhh    schedule 01.08.2017
comment
@ххх Конечно. Все функции Java хранятся здесь   -  person Ettore Rizza    schedule 01.08.2017
comment
@Ettero Rizza github.com/vpnagraj/rrefine/issues/4 запрос по этому вопросу для уточнения пакета.   -  person hhh    schedule 01.08.2017