Проблемы с производительностью полибазы

Я пытаюсь подключить свои кластеры Hadoop (Cloudera) из Polybase 2016. Когда я запрашиваю кластеры Hadoop из Polybase, я получаю очень низкую производительность. На самом деле это в 50 раз медленнее, чем локальные таблицы SQL Server при том же размере данных. Кто-нибудь работал над улучшением производительности запросов в Polybase?

С уважением,

Риту Ранджан


person Rituranjan Routray    schedule 07.04.2017    source источник
comment
Есть ли шанс получить производительность?   -  person Joy George Kunjikkuru    schedule 11.08.2017


Ответы (1)


Это ожидаемое поведение, поскольку Polybase генерирует код Map Reduce. Map Reduce на данном этапе считается устаревшей технологией. Polybase также имеет различные другие ограничения pushdown, например. он не отправляет соединения в Hadoop.

person Uli Bethke    schedule 14.10.2017