Добавление двух файлов в Open Refine и Drilling down через два столбца

У меня два вопроса по Open Refine

  1. У меня есть несколько наборов данных в виде файлов Excel, но я хочу загрузить их все в Open Refine. Как добавить файл A, файл B и файл C в Open Refine? Все файлы имеют одинаковые имена столбцов. Обратите внимание: я не пытаюсь объединить или объединить одно общее уникальное поле в ячейку. Я просто хочу объединить три файла в один проект.

  2. У меня есть набор данных, который включает поля Тип проверки и Нарушения. Некоторые из общих категорий в разделе «Тип проверки» - это несчастный случай, жалоба, направление, запланированный и некоторые другие. Категории / записи нарушений содержат три общих типа: серьезные, повторяющиеся, преднамеренные. Что мне нужно проанализировать, так это то, как каждый тип проверки (скажем, для несчастных случаев) соответствует нарушениям и каков их количество. Например, для скольких типов инспекции Несчастных случаев нарушение было признано серьезным или преднамеренным, и отобразить эту информацию в отдельном столбце. Мне удалось фасетировать столбец «Тип проверки», чтобы подсчитать количество категорий по каждому типу, но я не смог перейти к следующему шагу.

Любая помощь будет высоко ценится!


person The Magiclightbulb    schedule 03.10.2014    source источник


Ответы (2)


Ссылаясь на Открыть уточнение - добавить еще один файл в существующий проект, вы можете экспортировать каждый проект в CSV-файлы, создать zip-файл, содержащий эти CSV-файлы, а затем повторно импортировать его в OpenRefine.

person YudhiWidyatama    schedule 24.06.2017

1. Добавить файлы

Когда вы создаете свой проект в Refine, у вас есть возможность выбрать «Рабочие листы для импорта». Панель предварительного просмотра позволяет убедиться, что все в порядке, прежде чем создавать проект. Если это не сработает, лучше всего сделать это в Excel First.

2. Фацетирование

Обратите внимание, что вы можете объединить несколько фасетов вместе, например, вы можете сначала выбрать все записи, принадлежащие определенному типу проверки, а затем создать новый фасет в поле Несчастный случай, чтобы иметь граф. Вы можете создать новый столбец, чтобы добавить счетчик.

PS В Stack Overflow лучше всего задавать только один вопрос на вопрос. Затем создайте ветку по вопросам.

person magdmartin    schedule 06.10.2014
comment
Спасибо, Магдмартин. Прокомментирую Q.1. Чтобы уточнить, я не говорю о листах из того же файла. Я говорю о том, как объединить разные проекты, которые были загружены в OpenRefine, например проект A из файла A, проект B из файла B, и хочу добавить / объединить два проекта в один A + B. Нечто аналогичное функции слияния в Google Fusion Tables. - person The Magiclightbulb; 06.10.2014
comment
Refine не может его поддерживать, вам придется объединить файл вне приложения. - person magdmartin; 07.10.2014