Распространение реплицированной таблицы для небольшого измерения в хранилище данных SQL (Azure Synapse) с 1 вычислительным узлом

Microsoft предоставляет руководство по проектированию реплицированных распределений таблиц в SQL DW, но мне не ясно, есть ли преимущества у этого типа распределения для небольших уровней обслуживания (sub DW1000), где выделяется только один вычислительный узел.

Выгодно ли развертывание уровня служб нижнего уровня с одним вычислительным узлом от этого типа распределения для небольших размеров (например, страны, календаря и т. Д.), Или следует выбрать другой вариант распространения?


person Matt    schedule 13.07.2020    source источник
comment
Похоже, это то же самое, что и ROUND_ROBIN, пока вы не переключитесь на уровень с дополнительным вычислительным узлом.   -  person Matt    schedule 16.07.2020
comment
Если вы присоедините таблицу с циклическим перебором к распределенной таблице, вы увидите шаги в случайном порядке в плане запроса. Он по-прежнему выполняет соединения, совместимые с дистрибутивами, даже несмотря на то, что все это находится на одном узле, поскольку все еще разделено на 60 дистрибутивов. Однако, если вы присоедините реплицированную таблицу к распределенной, вы, скорее всего, не увидите перемешивания. Таким образом, реплицируемые таблицы имеют смысл даже на небольших уровнях обслуживания DWU.   -  person GregGalloway    schedule 11.08.2020


Ответы (2)


Преимущество репликации таблиц на всех уровнях. Помните, что в Azure Synapse SQL есть узлы и распределения, распределяющие данные по хранилищу. Таким образом, Synapse SQL будет реплицировать данные в разных дистрибутивах. Вся идея таблиц репликации и распределенных таблиц состоит в том, чтобы уменьшить перемещение данных. Взгляните на схему реплицированных таблиц в в этом блоге.

person abren    schedule 15.10.2020

Ответ - да, вы получите выгоду от репликации таблиц даже на небольших DWU. Причина этого в том, что когда вы выполняете свой запрос, этот запрос делится на 60 выполняемых запросов. Так что новички забывают, что у вас всегда есть 60 дистрибутивов, независимо от количества DWU. Репликация означает, что у вас всегда будет полная копия реплицированной таблицы в каждом дистрибутиве. Итак, это причина, потому что с реплицированными таблицами вы исключите перетасовку, которая отлично подходит для выполнения вашего запроса. (Другими словами, запрос будет содержать все данные о распределении, в котором выполняется.)

Кроме того, вы должны иметь в виду, что Microsoft утверждает, что хорошими кандидатами для реплицируемых таблиц являются таблицы размером ‹= 2 ГБ. Вы можете предположить, что с репликацией вы принесете дополнительные расходы на хранение, потому что ваша таблица будет занимать 60-кратное текущее хранилище из-за репликации. Но, как всегда, оптимизация - это компромисс между некоторыми значениями.

person neca77    schedule 22.12.2020