В рамках обмена разумом довелось на днях протянуть руку помощи в Грецию — помочь тамошнему инженеру Exchange ответить на вопрос заказчика, почему его 4-нодовый отказоустойчивый растянутый в облако DAG-кластер вдруг развалился, как пирамидка из кубиков.
Дано: две ноды кластера (node 1, node 2) размещены на площадке заказчика (on-premise), ещё две (node 3, node 4) где-то «в облаке», File share witness (на отдельном сервере, но тоже у заказчика), ОС Windows 2008 R2.
Проблема: всё пропало, кластер развалился, Exchange, соответственно, потерял базу и впал в прострацию.
Задача: понять почему, и сделать так, чтоб больше такого не было. Никогда. Хе-хе…