Есть такая штука, как подарочный сертификат на получение эмоций. Так вот сертификата у меня нет, а эмоции начались еще с вчерашнего вечера. Началось все с “пропадания” хоста виртуализации. В принципе, беды большой не произошло – все виртуальные машины перезапустились на доступных нодах кластера виртуализации, но неприятный осадок остался и разобраться в ситуации хотелось.
Первичная диагностика показала что пропал сетевой адаптер.
А адептер тут достаточно распальцованый – по нему работает сеть и огранизовывается доступ к дисковым хранилищам.
Загруженный ESX так же подтвердил что сетевых адаптеров нет.
После этого был открыт кейс в HP. Отзвонившийся инженер поддержки предложил 2 варианта – попробовать сбросить биос или заменить всю плату.
Т.к. мы не сторонники хируршических методов – идем по первому варианту 🙂
Сброс биоса на лезвии HP включает в себя 2 переключения системного переключателя на плате и 2 перезагрузки.
1. Вытащите сервер из корзины и откройте крышку сервера
2. Найдите System Maintenance switch на системной плате:
3. Установите переключатель 6 на позицию On и включите сервер
4. Дождитесь загрузки сервера, после чего выключите его и верните переключатель
в исходное положение.
Тадам – все заработало. В iLo интерфейсе появились все сетевые адаптеры,
ESX загрузился штатно.
Но сервер как не был доступен по сети, так и остался ушедшим в себя.
Задумавшись над вопросом “Ну и чё б это могло быть?” идем прямо в консоль Virtual Connect. Не то чтобы я был мега гуру, но проблема нашлась почти сразу – Port Status “больного сервера” – “Not Linked/Pause Flood Detected”
(эту картинку я своровал в инете, как-то не додумался свою заскриншотить 🙁 )
Корень зла найден, но пока неясно как лечить. Google в пару минут помогает понять причины такого мерзкого поведения и найти волшебное лекарство.
Лечение –
1. Подключиться к Virtual Connect по SSH
2. Выполнить команду show port-protect (проверить что в консоли информация такая же, как на web-странице Virtual Connect)
3. Выполнить команду reset port-protect
4. Убедиться что все исправилось повторным выполнением команды show port-protect
Проверить доступность сервера по сети.
Бинго – все работает 🙂