я хотел бы знать, будет ли запуск msck repair <table>
на таблице генерировать статистику таблицы для CBO, когда:
hive.cbo.enable=true
hive.stats.autogather=true
или мне нужно использовать analyze <tablename> compute statistics
.
Спасибо
я хотел бы знать, будет ли запуск msck repair <table>
на таблице генерировать статистику таблицы для CBO, когда:
hive.cbo.enable=true
hive.stats.autogather=true
или мне нужно использовать analyze <tablename> compute statistics
.
Спасибо
Он может собирать статистику при запуске РЕМОНТА. Но это считается ошибкой, потому что в этом случае команда REPAIR выполняется неожиданно медленно.
Существует ряд связанных JIRA:
HIVE-18743 HIVE-19489 HIVE-17478 SPARK-17063
hive.stats.autogather=false
перед РЕМОНТОМ - это временное решение.
Поскольку это считается ошибкой, вам лучше не полагаться на эту функцию и анализировать при необходимости.
Нашел этот связанный вопрос: https://stackoverflow.com/a/57885181/2700344