Я провел некоторое время в Google в поисках пакета очередей/балансировщика нагрузки для R.
Чего я пытаюсь достичь:
- выполнение нескольких независимых друг от друга функций R из удаленных интерфейсов
- использование 2 двухъядерных серверов в качестве бэкэнда R
Знаю это:
- каждая функция обычно обрабатывается от 10 до 30 секунд
- в среднем каждые 5 минут (но может и одновременно) на бэкэнд отправляется набор из 8-15 функций для выполнения (в очереди на обработку: first in first out). 5 минут - это среднее время, также можно отправить несколько комплектов одновременно.
- экземпляр 2x2 R уже был бы запущен с загруженными требуемыми пакетами, они всегда одинаковы, поэтому нет необходимости перезагружать их все время
- входной объем передаваемых данных очень низкий: макс. 50 КБ
Здесь нет темы распараллеливания кода (snow, snowfall foreach, condor и другие традиционные кластерные решения)
Знаете ли вы хороший пакет/инструмент, разработанный для R, который мог бы помочь?
Большое спасибо !