Проблемы с кэшем кластера NCache, работающим в одном кластере, после того, как другой экземпляр отключается

У нас есть реплицированный кластерный кеш с двумя экземплярами, все работает хорошо, когда оба экземпляра подключены к сети, и мы используем Community Edition 4.8.

Когда мы переводим экземпляр в автономный режим, управление кешем становится очень медленным, и даже остановка и запуск кеша из графического интерфейса NCache Manager занимает очень много времени, а затем показывает сообщение о том, что существует недоступный экземпляр.

Также при попытке получить данные из кэша или добавить в него данные выдается исключение тайм-аута операции, и нет ответа от единственного экземпляра, который все еще работает.

Насколько я понимаю, этот сценарий должен обрабатываться самой службой кеша, поскольку она реплицируется, и она должна обрабатывать сбой для экземпляра, отключающегося от сети.

Спасибо,


person Mousa Shawar    schedule 28.03.2018    source источник


Ответы (1)


Я хотел бы объяснить причину замедления вашего приложения, когда один из серверных узлов удаляется из кластера кеша.

Что происходит, когда узел удаляется из кластера кеша, выжившие узел/узлы переходят в процесс восстановления и пытаются восстановить соединение с этим отключенным серверным узлом. По умолчанию для этого значения повторной попытки подключения установлено значение «2», что означает, что уцелевшие узлы попытаются повторно подключиться к отключенному узлу два раза, и после неудачного повторного подключения кластер кеша будет рассматривать отключенный сервер и автономный режим, и кластер запустится. обработка запросов, как и раньше. Этот процесс повторного подключения может занять до 90 секунд, поскольку это интервал времени ожидания TCP/IP по умолчанию, и если для повторной попытки подключения установлено значение «2», процесс восстановления может занять до 200 секунд. Ваше приложение (или вызовы NCache Manager) может работать медленно или с тайм-аутом запроса в течение этого 2-3-минутного окна, когда кластер находится в режиме восстановления, но после завершения процесса восстановления приложение должно начать работать без каких-либо проблем. Если замедление или тайм-аут запроса длятся более нескольких минут

Значение повторной попытки подключения можно изменить в файле NCache «Config.ncconf». Увеличение количества повторных попыток подключения будет означать, что кластер будет тратить больше времени на процесс восстановления. Цель этой функции заключается в том, что если в среде произойдет сбой сети и узлы сервера потеряют связь друг с другом, серверы будут автоматически переподключены благодаря этому процессу восстановления. По этой причине рекомендуется установить для интервала повторных попыток подключения значение не менее 1.

person Shoeb Lodhi    schedule 17.04.2018