Airflow создать dag api или функцию

Есть ли какой-либо API или функция, которая может создавать DAG в воздушном потоке по запросу? У нас есть более тысячи DAG в папке DagBag, и планировщику требуется значительное время для сканирования, и, следовательно, производительность падает. Мы увеличили время сканирования папки DagBag до 1 дня, чтобы управлять этим поведением, но каждый новый созданный DAG требует перезапуска планировщика, чего мы хотели бы избежать. Пожалуйста, порекомендуйте.


person Madhup Srivastava    schedule 26.08.2020    source источник
comment
вы прошли через сериализацию DAG? Кстати "..and therefore performance is degrading.." это относится к scheduler или webserver?   -  person y2k-shubham    schedule 26.08.2020
comment
Проблема с производительностью связана с планировщиком. Пожалуйста, посоветуйте дальше.   -  person Madhup Srivastava    schedule 26.08.2020


Ответы (1)


Вероятно, вы можете делать следующее:

  • Перенесите всю вашу основную логику в даги в вызываемые функции
  • И иметь общий Dag, который будет вызывать эти функции, содержащие вашу основную логику, и выполнять в заданное определенное время.

Вам нужно будет где-нибудь сохранить список ваших основных функций и время выполнения (это может быть база данных или какой-то файл, который вы можете прочитать)

Это будет случай наличия небольшого расписания поверх воздушного потока, которое является избыточным, поскольку воздушный поток делает то же самое для вас, но я думаю, что ваш вариант использования выиграет от этого.

person khari-sing    schedule 27.08.2020