Привет всем!
Дано:
1. 3 узла под управлением CentOS 6.4.
2. На них развернут кластер высокой доступности под управлением Pacemaker'а (из штатных репов).
3. Управляет он тремя десятками ресурсов. Точнее - ресурсов поменьше, но они объединены в группы, а те - тоже ресурс.
Проблема:
Когда в кластере живет один только drbd (Primary/Secondary), то pacemaker вполне шустро переключает узлы. За несколько секунд. А вот когда кластер насыщаем нужными ресурсами, опаньки. Оно становится колом и на отключение какого либо узла может регировать очень долго, несколькими минутами, если не дольше... Ну и остановка кластера (service pacemaker stop) может идти более чем долго. Может долго ждать выключения ресурсов, которые выключаться не спешат. А далее - долго ждет выгрузки кластерных сервисов. Которые тоже не спешат выгружаться. И, кстати, загрузки процессоров при этом нет никакой, просто всё висит на таймаутах...
Вопрос очевиден. Это есть ненормально и как от такой ненормальности избавиться?