Я пытаюсь загрузить данные из своих внешних таблиц во внутренние таблицы SQL DW. У меня есть хранилища данных в сжатом формате в хранилище BLOB, а внешние таблицы указывают на расположение хранилища BLOB.
У меня есть около 24 файлов, размер которых составляет около 22 ГБ, и я пытаюсь загрузить данные из внешней таблицы во внутреннюю таблицу на 300 DWU с более крупной учетной записью службы/пользователя класса ресурсов.
Моя вставка в выписку (которая очень прямолинейна) выполняется более 10 часов. вставить в Trxdata.Details_data выбрать * из Trxdata.Stage_External_Table_details_data;
Я также пробовал с приведенным ниже заявлением, которое также работает более 10 часов. CREATE TABLE Trxdata.Details_data12 WITH (DISTRIBUTION = ROUND_ROBIN) AS SELECT * FROM Trxdata.Stage_External_Table_details_data;
Я вижу - оба SQL выполняются со статусом ACTIVE в "sys". "dm_pdw_exec_requests" [я думал, что это может быть проблема со слотом параллелизма, и у него нет слотов параллелизма для запуска, но это не так]
и я надеялся, что увеличение/увеличение DWU может улучшить производительность. но, глядя на использование DWU на портале.azure.com, я не уверен, что стоит увеличивать DWU, потому что на диаграмме использования DWU показано ‹50DWU за последние 12 часов.
Итак, я пытаюсь понять, как я могу найти, что занимает так много времени. Как я могу повысить производительность загрузки данных?