У меня есть следующий вариант использования, для решения которого, похоже, подходит OpenRefine. В моей базе данных есть "грязная" таблица продуктов, которая выглядит следующим образом:
id name
51 Product A
52 product-a
53 product B
54 productb
55 produtc
56 productc
У меня есть новая, "чистая" таблица продуктов, которая выглядит так:
id name
1 Product A
2 Product B
3 Product C
Я хотел бы использовать кластеризацию OpenRefine для создания файла сопоставления, чтобы помочь мне сопоставить продукты из старой таблицы с новой таблицей:
id name old_id
1 Product A 51
1 Product A 52
2 Product B 53
2 Product B 54
3 Product C 55
3 Product C 56
Но я не могу заставить OpenRefine делать то, что я хочу. Любой совет, как этого добиться?