Невозможно загрузить текстовые данные в таблицу Hive как ORC через временную таблицу Hive

Я хочу загрузить .csv файл в таблицу Hive как файл ORC. Я наткнулся на одно сообщение < / a>, в котором было предложено решение проблемы, для которой я выполнил следующие запросы:

1) Создание и загрузка данных в виде текстового файла во временную таблицу:

CREATE TABLE IF NOT EXISTS CrimesData( ID int, Case_Number int, CrimeDate string, Block string , IUCR string,Primary_Type string, Description string, Location_Description string, Arrest string, Domestic string, Beat int, District int, Ward int, Community_Area int, FBI_Code string, X_Coordinate int, Y_Coordinate int, Year int, Updated_On string, Latitude decimal(10,10), Longitude decimal(10,10), CrimeLocation string) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ESCAPED BY '"' LINES TERMINATED BY '\n'
tblproperties("skip.header.line.count"="1")
LOAD DATA LOCAL INPATH '/home/cloudera/Documents/CrimesData.csv' INTO TABLE CrimesData

2) Создание новой таблицы и указание данных ORC в качестве источника:

CREATE TABLE IF NOT EXISTS CrimesDataORC( ID int, Case_Number int, CrimeDate string, Block string , IUCR string,Primary_Type string, Description string, Location_Description string, Arrest string, Domestic string, Beat int, District int, Ward int, Community_Area int, FBI_Code string, X_Coordinate int, Y_Coordinate int, Year int, Updated_On string, Latitude decimal(10,10), Longitude decimal(10,10), CrimeLocation string) 
STORED AS ORC;

3) Вставьте данные в новую таблицу из временной таблицы:

INSERT INTO TABLE CrimesDataORC SELECT * FROM CrimesData;

Первые два шага выполняются без ошибок, но шаг 3 вызывает следующую ошибку:

Ошибка при обработке оператора: FAILED: ошибка выполнения, код возврата 2 из org.apache.hadoop.hive.ql.exec.mr.MapRedTask

Я выполняю указанные выше запросы на Cloudera Manager Quickstart VM 5.8.

Не уверен, где я ошибаюсь, поскольку аналогичные шаги для другой таблицы в той же базе данных работают, как ожидалось.


person Chetan SP    schedule 17.04.2017    source источник


Ответы (1)


Это может быть несоответствие данных структуре. Попробуйте установить некоторые условия в операторе выбора, чтобы проверить, а вставляя все данные

person sadap    schedule 18.04.2017
comment
Спасибо за предложение, я попробую и обновлю, если это сработает или нет .. ???? - person Chetan SP; 18.04.2017
comment
Пытался выполнить: INSERT INTO TABLE CrimesDataORC SELECT * FROM CrimesData LIMIT 10; Но и тут не вышло .. :( - person Chetan SP; 23.04.2017