Я использую Hive v1.2.1 с Tez. У меня есть внешняя секционированная таблица. Разделы почасовые и имеют вид p = yyyy_mm_dd_hh. Ситуация такова, что эти каталоги разделов в hdfs, вероятно, когда-нибудь будут удалены. После их удаления улей по-прежнему содержит метаданные для этого раздела, а команда «показать разделы» по-прежнему выводит список раздела, каталог которого был удален из hdfs. Обычно это вряд ли вызовет какие-либо проблемы, и запрос выбора для раздела (каталог которого был удален) просто приведет к пустому набору результатов:
hive> select * from test_tab where p='2015_01_01_01';
OK
Time taken: 2.168 seconds
Однако при выполнении любого агрегированного запроса к тому же разделу я получаю сообщение об ошибке:
hive> select count(*) from test_tab where p='2015_01_01_01';
FAILED: SemanticException java.io.FileNotFoundException: File hdfs://localhost:8020/user/root/data/test_db/test_tab/p=2015_01_01_01 does not exist.
Мне нужно иметь такое же поведение в совокупных запросах, как и в других запросах на выборку. Вероятно, это ошибка улья. Мы будем благодарны за любые обходные пути для этой проблемы. С уважением.