Проверка диска Esxi на наличие ошибок

Обновлено: 03.07.2024

Хост VMware ESXi 5.5.x или 6.x обнаруживает ошибку остановки на фиолетовом экране (также известном как фиолетовый экран смерти (PSOD)), когда система простаивает, а разделы VMFS установлены на твердотельном накопителе (SSD). технологические жесткие диски.

Решение проблемы

Источник

Совет RETAIN: не используется

Симптом

Хост VMware ESXi 5.5.x или 6.x обнаруживает ошибку остановки на фиолетовом экране (также известном как фиолетовый экран смерти (PSOD)), когда система простаивает, а разделы VMFS установлены на твердотельном накопителе (SSD). технологические жесткие диски.

Затронутые конфигурации

В системе настроено хотя бы одно из следующего:

  • VMware ESXi 6.0, любая модель Любое обновление
  • VMware vSphere Hypervisor 5.5 с возможностью установки IBM Customization, любая модель, любое обновление

Система настроена с одним или несколькими из следующих номеров деталей IBM Option:

  • 2,5-дюймовый диск с самошифрованием Sunset Cove Plus, 12 ГБ, 400 ГБ, номер опции 00FN419, любая модель
  • 400 ГБ, 12 ГБ, 2,5 дюйма, Sunset Cove Plus, IBM, без самошифрования, номер опции 00FN394, любая модель
  • 400 ГБ, 12 ГБ, 2,5 дюйма, Sunset Cove Plus Lenovo, без SED, номер опции 00FN389, любая модель
  • Твердотельный накопитель SAS 400 ГБ, 6 Гбит/с, 2,5 дюйма, малый форм-фактор G2HS, номер опции 49Y6134, любой Optimus SAS
  • Твердотельный накопитель SAS 2,5 дюйма малого форм-фактора SS емкостью 400 ГБ, 6 Гбит/с, номер опции 49Y6149, любой Optimus SAS
  • Твердотельный накопитель SATA 400 ГБ, 6 Гбит/с, 1,8 дюйма, MLC SS, номер опции 41Y8371, любая модель
  • Твердотельный накопитель SATA 400 ГБ, 6 Гбит/с, 1,8 дюйма, номер опции 49Y6124, любая модель
  • 2,5-дюймовый твердотельный накопитель MLC HS SATA 400 ГБ, 6 Гбит/с, номер опции 41Y8336, любая модель
  • Твердотельный накопитель SATA 400 ГБ, 6 Гбит/с, 2,5 дюйма, MLC SS, номер опции 41Y8356, любая модель
  • 2,5-дюймовый твердотельный накопитель MLC HS Enterprise Value PCIe 400 ГБ для IBM System x, номер опции 90Y3227, любой 2,5-дюймовый PCIe 400 ГБ
  • 1,8-дюймовый твердотельный накопитель MLC Enterprise Value SATA 400 ГБ для IBM System x (Intel), номер опции 68Y7788, любой 00W1121
  • 1,8-дюймовый твердотельный накопитель MLC SS SATA 400 ГБ, номер опции 00AJ050, любая модель
  • 1,8-дюймовый твердотельный накопитель MLC SS SATA 400 ГБ, номер опции 90Y4318, любая модель
  • 1,8-дюймовый твердотельный накопитель MLC Enterprise Value SATA 480 ГБ, номер опции 00AJ345, любой номер детали
  • 2,5-дюймовый твердотельный накопитель MLC Enterprise Value SATA 480 ГБ, номер опции 00AJ330, любая модель
  • Твердотельный накопитель SATA 480 ГБ, 2,5 дюйма, MLC G3HS Enterprise Value, номер опции 00AJ181, любая модель
  • 2,5-дюймовый твердотельный накопитель MLC HS SATA 480 ГБ, номер опции 00AJ010, любой P400e
  • 2,5-дюймовый твердотельный накопитель MLC HS SATA 480 ГБ, номер опции 00AJ030, любая модель
  • Твердотельный накопитель SATA 3,5 дюйма MLC HS Enterprise Value на 480 ГБ, номер опции 00AJ470, любая модель

Этот совет не относится к конкретной системе.

В системе обнаружен симптом, описанный выше.

Примечание. Это не означает, что сетевая операционная система будет работать при любых сочетаниях аппаратного и программного обеспечения.

Дополнительную информацию см. на странице совместимости:

Решение

Эта проблема все еще находится на рассмотрении.

Временное решение

Не используйте твердотельный накопитель (SSD) Disk RAID в качестве хранилища VMFS для хоста VMware ESXi 5.5/6.0.

Вы бы сталкивались со многими случаями отказа жесткого диска ваших физических серверов. Необходимо определить, какой именно диск вышел из строя на сервере. Это можно легко проверить с помощью инструментов управления оборудованием, таких как HP system Management, HP ILO или даже на вкладке состояния оборудования хоста ESXi из vSphere Client. В этом посте рассказывается о проверке состояния сбоев диска для утилит командной строки хоста esxi. В этом посте я расскажу об оборудовании HP и о том, как проверить сбои диска из командной строки в оборудовании Hp. В этом посте вы найдете пошаговые инструкции по проверке состояния диска на хосте ESXi с помощью утилиты HPSSACLI, которая является частью автономного пакета HP ESXi Utilities Offline для VMware ESXi 5.x.

Автономный пакет HP ESXi Utilities для VMware ESXi 5.x будет доступен как часть индивидуального установочного образа HP ESXi, но если это не настроенный HP образ ESXi, вам может потребоваться загрузить и установить автономный пакет HP ESXi Utilities для VMware. ESXi 5.x. Этот ZIP-файл содержит 3 разные утилиты HPONCFG, HPBOOTCFG и HPSSACLI для удаленной онлайн-настройки серверов.

  • HPONCFG — утилита командной строки, используемая для получения и настройки конфигураций ProLiant iLO.
  • HPBOOTCFG — утилита командной строки, используемая для настройки порядка загрузки сервера ProLiant.
  • HPSSACLI — утилита командной строки, используемая для настройки и диагностики серверов ProLiant SmartArrays.

Вы можете загрузить и установить автономный пакет утилит HP ESXi для ESXi 5.X, используя следующую команду

esxcli software vib install -f -v /tmp/hp-esxi5.5uX-bundle-1.7-13.zip

Вы даже можете напрямую загрузить утилиту HPSSACLI и загрузить файл VIB на хост ESXi и выполнить приведенную ниже команду, чтобы установить утилиту HPACUCLI.

программное обеспечение esxcli vib install -f -v /tmp/hpssacli-1.60.17.0-5.5.0.vib

После установки. Перейдите к каталогу /opt/hp/hpssacli/bin и проверьте установку.

Проверьте статус отказа диска:

Введите приведенную ниже команду, чтобы проверить состояние дисков на вашем хосте ESXi. Он отображает состояние диска во всех массивах под контроллером.

/opt/hp/hpssacli/bin/hpssacli controller slot=0 физический диск все показывать

Сбой диска - Хост ESXi

Сбои диска - ESXi host_1

Вот так. Мы определили сбой диска. Возможно, вам потребуется создать отчет HP ADU (утилита диагностики массивов), чтобы обратиться в службу поддержки с поставщиком оборудования. Пожалуйста, обратитесь к моему сообщению в блоге «Как создать отчет о диске HP ADU на хосте ESXi», чтобы понять пошаговое руководство по созданию отчета ADU из командной строки хоста ESXi. Я надеюсь, что это информативно для вас. Спасибо за прочтение. Будьте общительны и поделитесь этим в социальных сетях, если считаете нужным поделиться этим.

Начиная с ESXi 5.1, можно проверить VMFS на несогласованность метаданных с помощью инструмента под названием VOMA (анализатор метаданных VMware Ondisk). С помощью VOMA вы можете проверить хранилища данных VMFS3 и VMFS5.

Обратите внимание, что инструмент может только выявлять проблемы, так как он работает в режиме только для чтения. Таким образом, это не поможет вам исправить обнаруженные ошибки.

Причины использования VOMA:

  • появление ошибок метаданных в журнале vmkernel
  • если вы столкнулись с перебоями в работе SAN
  • после восстановления RAID
  • если вы не можете изменить, стереть или получить доступ к файлам в хранилище данных VMFS, которое не используется другим хостом

Прежде чем запускать VOMA из интерфейса командной строки вашего хоста ESXi, позаботьтесь о следующих рекомендациях:

  • Выключите все виртуальные машины, работающие в хранилище данных VMFS (или перенесите их)
  • убедитесь, что том VMFS не используется другими хостами (рекомендуется: размонтировать хранилище данных на других хостах)
  • убедитесь, что хранилище данных не используется vSphere HA для проверки работоспособности
  • убедитесь, что хранилище данных не используется другими функциями, такими как управление вводом-выводом хранилища и т. д.
  • убедитесь, что том не является томом с несколькими объемами

Теперь войдите на свой хост ESXi и взгляните на доступные параметры VOMA (voma -h)

voma_parameters

Во-первых, вам нужно знать путь к разделу (naa.xxxxxx:1). Выполните следующую команду, чтобы отобразить список с именем тома, UUID VMFS и именем устройства:

список экстентов vmfs хранилища esxcli

Вывод должен быть примерно таким:

esxcli_storage_vmfs_extent_list

Если мы хотим сканировать VMLUN_01, мы должны объединить имя устройства (naa.60a98000646e6c…) и номер раздела (1) со знаком «:».

voma -m vmfs -f check -d /vmfs/devices/disks/naa. 60a98000646e6c50566f6a6c6a6831 64:1

Если VOMA работает успешно, вы должны увидеть что-то вроде этого:

Что делать, если VOMA обнаруживает ошибку?

Этот инструмент может только находить ошибки, но не исправлять их. Поэтому, если VOMA обнаружит какие-либо ошибки, обратитесь за дополнительной помощью в службу поддержки VMware.

Возможные причины/сообщения об остановке сканирования VOMA:

Если в хранилище данных, которое вы пытаетесь просканировать с помощью VOMA, есть активность, вы увидите следующий вывод:

Найден 1 активно проверяющий хост на устройстве / 1): MAC-адрес xx:xx:xx:xx:xx:xx

VOMA останавливает сканирование, так как в файловой системе VMFS есть активность. MAC-адрес указывает интерфейс управления хоста ESXi, вызвавший активность.

Обновление 2 для ESXi 6.7, выпущенное в мае 2019 г., добавляет VMFS6 в список файловых систем, поддерживаемых анализатором метаданных vSphere On-disk (VOMA), что позволяет проверять и устранять проблемы с метаданными томов VMFS, метаданными LVM и таблицей разделов. несоответствия.

Это означает, что вы можете сэкономить много ресурсов, времени и денег при устранении неполадок в хранилище данных VMFS6 без необходимости создавать дамп метаданных и обращаться в службу поддержки для их устранения.Повторение этого сценария без VOMA убьет дни работы, если у вас затронуто несколько хранилищ данных, а в некоторых случаях вам может потребоваться восстановление из резервных копий.

Прежде чем отправиться в это приключение, не зная результатов, очень важно иметь резервные копии для всех машин или тома. Вы можете клонировать том для работы с VOMA в клоне, не переводя рабочий том в автономный режим. Это будет зависеть от функций хранилища.

До версии VOMA 0.8

До этого обновления, если вы сталкивались с какой-либо ошибкой или повреждением метаданных в хранилище данных VMFS6, вам нужно было собрать (сбросить) метаданные хранилища данных и загрузить файл дампа в созданный запрос в службу поддержки VMware, а затем импортировать обновленный дамп обратно в ваш хранилище данных для любого шанса восстановить ваши машины после этих ошибок.

Поддержка VMware проанализирует загруженный файл и запустит сценарий для исправления ошибок (если их можно исправить), а затем поможет повторно применить метаданные к вашему тому.

После версии VOMA 0.8

Чтобы проверить хранилище данных VMFS6 с помощью VOMA, используйте эту команду:
voma -m vmfs -f check -d /vmfs/devices/disks/naa.xxxxxx:1
voma -m vmfs -f check - д /vmfs/devices/disks/naa.xxxxxx

Чтобы исправить обнаруженные ошибки, выключите все виртуальные машины в томе, отмените регистрацию всех виртуальных машин в инвентаре, отключите хранилище данных со всех хостов и VOMA с параметром -f fix
voma -m vmfs -f fix -d /vmfs /devices/disks/naa.xxxxxx:1
voma -m vmfs -f fix -d /vmfs/devices/disks/naa.xxxxxx

В данном случае :1 — это раздел для vmfs6. Вы можете получить отчет vmfs с помощью
esxcfg-scsidevs -m

Вы увидите такие сообщения. На каждом этапе будут отображаться существующие ошибки, если они есть

Запуск VMFS Checker версии 2.1 в режиме проверки
Инициализация метаданных LVM, основные проверки будут выполнены
Проверка активности файловой системы
Выполнение проверки работоспособности файловой системы..|Сканирование активности хоста VMFS-6
Этап 1. Проверка файлов заголовков и ресурсов VMFS
Обнаружена файловая система VMFS-6
Этап 2. Проверка региона пульсации VMFS
Этап 3. Проверка всех файловых дескрипторов.
Этап 4. Проверка имени пути и подключения.
Этап 5. Проверка счетчика ссылок на ресурсы.

Читайте также: