мы пытаемся интегрировать данные концентратора событий (EH) (~ 200 МБ и 50 тыс. сообщений в минуту) в промежуточную область хранилища данных SQL (DW).
До сих пор мы пытались решить эту проблему, напрямую считывая данные EH с помощью функции Azure (AF) и выводя их в Synapse, но мы достигли максимального количества одновременных открытых сеансов DW (512 для‹ DWU500c). Мы также пытались увеличить maxBatchSize, который считывается из EH, чтобы уменьшить количество необходимых сеансов на стороне DW, но это, похоже, делает AF довольно нестабильным.
Сегодня я нашел это руководство в документации Microsoft, которая отделяет EH от AF с помощью функции захвата EH и сетки событий (EG) для запуска AF при каждой записи файла Blob. Итак, правильно ли я предполагаю, что это должно резко уменьшить максимальное количество одновременных открытых сеансов в DW, поскольку мы говорим о гораздо больших размерах пакетов, когда AF считывает захваченные файлы Blob, которые могут быть размером до 500 МБ?
Какие преимущества есть между одним решением и другим? Есть ли у вас какие-либо другие передовые методы для достижения этой цели?
Спасибо заранее!