Я пытаюсь сгенерировать некоторые паркетные файлы с помощью улья, для этого я загрузил обычную таблицу улья из некоторых файлов .tbl с помощью этой команды в улье:
СОЗДАТЬ ТАБЛИЦУ REGION (R_REGIONKEY BIGINT, R_NAME STRING, R_COMMENT STRING)
РАЗДЕЛЕННЫЕ ПОЛЯ ФОРМАТА СТРОКИ, ОСТАНОВЛЕННЫЕ НА '|' СОХРАНЯЕТСЯ КАК ТЕКСТФАЙЛ расположение '/ tmp / tpch-generate';
После этого я просто выполняю эти 2 строки:
создать таблицу parquet_reion КАК регион ХРАНИТЬ КАК ПАРКЕТ;
вставить в parquet_region select * from region;
Но когда я проверяю вывод, сгенерированный в HDFS, я не нахожу ни одного файла .parquet, я могу найти файлы с именами, такими как от 0000_0 до 0000_21, и сумма их размеров намного больше, чем исходный файл tbl.
Что я делаю неправильно?