Проверить рейд-массив на наличие ошибок

Обновлено: 02.07.2024

Я всегда читал противоречивую информацию о том, безопасно ли использовать chkdsk на томе, который находится в массиве RAID, поэтому я хотел бы решить этот вопрос раз и навсегда (во всяком случае, мысленно).

Насколько я понимаю, единственная потенциальная проблема должна быть связана с использованием ключа /R, так как «исправление» того, что chkdsk считает поврежденными секторами, может привести к повреждению массива. Хотя, если честно, меня всегда смущал риск, связанный с этим, поскольку кажется, что chkdsk должен иметь доступ к дискам на более низком уровне, чем позволяет RAID-контроллер. Если chkdsk не может получить доступ к дискам в массиве по отдельности, как она может изменить данные, которые могут повредить массив? но я отвлекся..

Помимо использования /R, есть ли ситуации, когда использование chkdsk на томе, расположенном в массиве RAID, отличается от использования на одном диске?

Есть ли какие-либо авторитетные материалы по этому вопросу? Я могу найти только сообщения на форуме, в которых говорится: «Не делай этого!» или "Все в порядке!" без особых причин, чтобы поддержать это.

Махасд

Участвуйте, чтобы выиграть еженедельные подарочные карты (от 100 евро), Oculus и наушники/колонки

Конкурс завершается 27 марта 2022 г. Конкурсы Каждую неделю узнайте больше о том, как Red Hat может помочь вам добиться простоты и цифровых инноваций, и ответьте на вопрос. Детали конкурса Просмотреть все конкурсы

Джон Уайт

Этот человек является проверенным специалистом

Джон Уайт

Skygod писал:

Magnus369 писал: Отвечает достаточно четко — chkdsk не проверяет диск на аппаратном/физическом уровне.

Джон Уайт писал: «Правда? Уровень файловой системы — это уровень абстракции над физическими дисками."

Самолеты летают . Почему? Потому что самолеты летают!

Понятие абстракции может быть простым, но вы говорите об этом понятии так, как если бы оно было осязаемым и абсолютным. «Абстракция» — это не более чем обобщение концептуализации. Нельзя удержать «абстракцию» лучше, чем ветер. Вы констатируете абсолютные факты, цитируя концепцию? Вся концепция удобно и окончательно резюмирована таким образом, чтобы полностью ответить на вопрос ОП? Как, должно быть, повезло ОП, ведь ответы на его вопросы не дальше, чем в первом предложении. Остальным из нас должно быть так повезло! Я был скромен, я хорошо разбираюсь в этом вопросе. Вопрос ОП - это разумный вопрос, и он открыт для интерпретации на нескольких уровнях, а не только на самых верхних поверхностных уровнях - он абстрагирован! Это абстрагировано! Кроме того, что это слово дня, что это вообще значит?! Файловая система абстрагирована от аппаратного обеспечения. Вот и все? Абстракция только между оборудованием и файловой системой? Что с прошивкой? Что с ядром? Что насчет приложений? Как насчет и т. д. Ваше объяснение едва ли могло удовлетворить любопытство программиста низкого уровня (им не нужна абстрактная модель). Но как насчет любопытства пользователя, который никогда не подходит к оборудованию ближе, чем его глаза подходят к экрану? Как повторение слова «абстракция» снова и снова объясняет ОП специфику, которую он ищет? Особенно, когда ОДНИМ предложением позже в той же вики упоминается: «CHKDSK также может проверять поверхность диска на наличие физических ошибок» и «CHKDSK также может обрабатывать некоторые физические ошибки». Мне все еще неясно, каким образом эти ссылки помогают решить вопрос ОП? ОП спрашивает подробности, он не хочет слышать слово «абстракция» снова и снова, он хочет знать «почему» на более глубоком уровне, чем ОДНО слово в ПЕРВОМ предложении.

Я спишу это на плохой день или что-то в этом роде, а не на преднамеренную тупость или троллинг.

Инструменты операционной системы, такие как chkdsk, проверяют структуры данных файловой системы на согласованность. Я думаю, что OP ссылается на флаг / r, который будет проверять доступность и согласованность базовой структуры диска (оранжевый уровень). Если содержимое структуры данных невозможно получить, выполняются повторные чтения до тех пор, пока либо структура диска не будет помечена как неправильная, либо информация не станет доступной, после чего она сопоставляется с другой частью диска, предполагая, что исходная " испортилось" (синий уровень).

Однако в случае с диском RAID уровень синего цвета не обозначает физический диск. Это логическое представление диска, состоящего из некоторой сложной (или простой) структуры физического диска.

CHKDISK проверяет целостность оранжевого уровня.

CHKDISK /R проверяет целостность сопоставления оранжевого и синего цветов и пытается восстановить труднодоступные данные синего уровня, перемещая их в другое место на логическом диске.

linkdin

Написано Манси Верма

linkdin

Одобрено Рохитом Арора

Обновлено 19 января 2022 г.

Чтение мин. 5 мин.

Непрерывный мониторинг работоспособности RAID — это лучший способ, чем периодическая проверка работоспособности дисков. Потому что с проверкой диска на основе интервалов вы не сможете отследить проблемы с работоспособностью диска, которые возникли на неконтролируемой фазе. Это означает, что обнаружение проблемы происходит с задержкой по сравнению с фактическим моментом ее возникновения.

Давайте подробно рассмотрим этот сценарий:

Администраторы часто жалуются на сбой конфигурации RAID из-за повреждения диска, несмотря на регулярный мониторинг состояния и конфигурации жесткого диска. Дело в том, что «периодического» мониторинга работоспособности недостаточно, так как периода времени между двумя проверками может быть достаточно, чтобы повредить диск и повлиять на весь RAID.


Этой ситуации можно легко избежать, если принять меры и следить за состоянием работоспособности жесткого диска RAID в Windows.

Важным моментом является то, что проверка жесткого диска (даже если она выполняется через регулярные промежутки времени) не обеспечивает круглосуточный мониторинг гаджета. Следовательно, если авария обрушится на жесткий диск на неконтролируемой фазе, результаты не будут отображаться до следующей проверки или возникновения функциональной проблемы. Таких аварий легко избежать с помощью программного обеспечения для мониторинга жестких дисков RAID.

Как контролировать состояние работоспособности жесткого диска RAID?

Существует несколько способов мониторинга жестких дисков:

  • Инструменты мониторинга от производителей жестких дисков:

Производители жестких дисков предоставляют собственные средства мониторинга для отслеживания состояния и производительности жестких дисков. Вот как вы можете найти и использовать утилиту мониторинга для вашего жесткого диска -


  • Узнайте марку и номер модели жесткого диска.
  • Перейдите на страницу поддержки жесткого диска на сайте производителя и найдите утилиту жесткого диска.
  • Активируйте диагностические функции жесткого диска, чтобы проверить его работоспособность на основе технологии самоконтроля, анализа и отчетности или технологии S.M.A.R.T. атрибуты.

Встроенный инструмент Windows сканирует диски для обнаружения системных ошибок. Команда CHKDSK также помогает при проблемах с жестким диском. Встроенный инструмент сканирует и устраняет проблемы, если это возможно, или сообщает о них. Регулярные проверки помогают смягчить проблемы, связанные с плохим состоянием диска.


< /p>

WMIC – это интерфейс командной строки для мониторинга S.M.A.R.T. атрибуты жесткого диска. Он предоставляет простой вывод в виде «ОК» или «Pred Fail». Эта встроенная функция представляет собой базовую команду и предоставляет только ограниченную информацию.


< /p>

  • Опция «Мониторинг диска» программного обеспечения Stellar Data Recovery Technician

Stellar Drive Monitor, который поставляется вместе с многофункциональным программным обеспечением для восстановления RAID, представляет собой монитор диска в режиме реального времени, помогает отслеживать несколько параметров жесткого диска, и когда какой-либо отслеживаемый атрибут превышает пороговое значение, приложение отображает предупреждение.


< бр />

Программное обеспечение позволяет пользователям выбирать диск из RAID-диска для проверки состояния выбранного диска.

Почему стоит выбрать монитор SMART Drive?

<р>1. Инструмент для жесткого диска производителя зависит от бренда. Монитор диска Samsung контролирует только устройства Samsung. Самсунг не может наблюдать диски других марок. Также, если вместе с диском Samsung установлен диск какой-либо другой марки, то другой диск не может быть отслежен, так как система не позволяет загрузить монитор диска для другой марки или марки.

<р>2. CHKDSK и WMIC являются инструментами проверки и не предоставляют полную информацию о состоянии диска.

<р>3. Установить и запустить Stellar Drive Monitor в Windows 10 очень просто. После активации S.M.ИЗОБРАЗИТЕЛЬНОЕ ИСКУССТВО. программное обеспечение можно использовать для мониторинга различных атрибутов жесткого диска, таких как состояние диска, интеллектуальное состояние, раздел диска, сканирование диска и клонирование диска.



Он отслеживает физическое состояние диска — температуру, работоспособность и производительность диска. Пользователи могут определить порог и критический предел для приложения. Любое отклонение от нормы иллюстрируется цветом, где синий соответствует идеалу, оранжевый — приемлемому, а красный — худшему. Большинство пользователей принимают меры, как только состояние диска начинает отображаться оранжевым цветом, и защищают работоспособность жесткого диска RAID, действуя упреждающе.

Этот модуль измеряет коэффициент пригодности диска и определяет состояние атрибутов. Пороговое значение отображает предел, выше которого диск может выйти из строя. Stellar Drive Monitor отображает пороговое значение, чтобы помочь сохранить диск и RAID от поломки.

Он отслеживает все разделы на диске и отображает состояние раздела, состояние каждого раздела и доступное пространство. Системные администраторы могут судить о состоянии и объеме памяти по доступным значениям.

Определяет и отображает поврежденные сектора на диске. Если количество поврежденных секторов велико, рекомендуется заменить диск.

Этот процесс помогает скопировать все данные с исходного диска на доступный целевой диск, сохраняя при этом данные исходного диска.

В целом упреждающее функционирование Drive Monitor помогает пользователям отслеживать состояние здоровья жестких дисков RAID и защищает их от нежелательной потери данных.

Вывод

Организации принимают ряд мер для защиты своих данных — наиболее важного компонента. Одной из таких мер является использование конфигурации RAID на дисках. Устройства хранения с конфигурацией RAID также помогают повысить производительность и отказоустойчивость. Поскольку в конфигурации RAID задействовано множество дисков, крайне важно следить за состоянием отдельных жестких дисков и избегать ситуаций потери данных.

Развертывание Drive Monitor для проверки состояния работоспособности жесткого диска RAID в Windows позволяет отслеживать работоспособность и производительность дисков и заранее принимать соответствующие меры.

4 различных метода проверки состояния RAID

Чтобы узнать, какой RAID вы используете, просто введите одну команду в командную строку:

lspci | ГРЭП RAID

На этот запрос может быть несколько ответов:

Если вы не получили ответ или какой-либо другой ответ, то, скорее всего, у вас есть программный RAID.

RAID и их статус

Для этого введите «tw_cli». В разных системах это может быть tw_cli.amd64 или tw_cli.i386.

После этого вам нужно найти номер вашего контроллера и проверить его статус.

Команда 3ware RAID для проверки состояния

Команда 3ware RAID для проверки состояния

Где c1 — контроллер.

Затем посмотрите на столбец «Статус»; он показывает состояние массива.

Здесь вам нужно ввести следующую команду:

Команда HP RAID для проверки состояния

Команда HP RAID для проверки состояния

В результате вы увидите, работает RAID или нет.

Если все работает нормально, вы увидите на экране OK.

В этом случае введите:

Команда MegaRAID для проверки состояния

Команда MegaRAID для проверки статуса

В столбце Hlth статус должен быть Opt.

Если нет, значит есть проблемы с массивом.

Этот RAID находится в диапазоне, указанном в предыдущих полях значений и в FSx.

Вывод будет таким:

Команда программного RAID для проверки состояния

Команда программного RAID для проверки состояния

[UU] или U = исправный, полнофункциональный раздел RAID.

[_U] или [U_] = неисправный диск.

Статусы RAID могут отличаться в утилитах

Если вы используете специальную утилиту, например Adaptec Storage Manager, могут быть и другие статусы:

  • Ошибка: вообще не работает; здесь также должна быть выделена конкретная ошибка и к какому диску она относится.
  • Восстановление: возвращено в оптимальное состояние. Это состояние является промежуточным, поэтому состояние RAID не очень хорошее.

Восстановление RAID: ключ к безопасности данных RAID

Лучший вариант восстановления массива — DiskInternals RAID Recovery.

После загрузки и установки приложения на свой компьютер вам достаточно открыть его и нажать кнопку «Восстановление RAID», после чего выбрать режим чтения. Повторно сохраните восстановленные данные во внешнем хранилище данных.

Вы также можете использовать режим восстановления Uneraser, если некоторые или все данные были удалены с любого RAID.

RAID Recovery — это самый передовой инструмент на рынке, который автоматически определяет тип RAID-массива, файловую систему, количество и порядок дисков и контроллер, в то же время обеспечивая полностью ручное управление. Утилита совместима с устройствами Dell, Adaptec, HP, MegaRaid и DDF, а также силиконовыми RAID-контроллерами. Данное ПО подходит для всех типов массивов: RAID 0, 1, 0+1, 1+0, RAID 4, RAID 5, 10, 50, 5EE, 5R, RAID 6, 60 и JBOD, которые подключены к выделенному материнская плата контроллера RAID с поддержкой RAID от VIA, NVidia или Intel.

С помощью этого приложения вы гарантированно восстановите более 90% данных с поврежденного массива.

У меня есть RAID 1 с 4 жесткими дисками в зеркальном массиве. Недавно мое программное обеспечение RAID сообщило, что один из дисков был удален из массива и с тех пор был помечен как «восстановление», однако во время процесса восстановления я продолжаю получать ошибки контроллера RAID, что данные не могут быть синхронизированы / записаны на диск. Я не уверен, что делать дальше. Есть ли способ самостоятельно проверить диск на наличие ошибок? Я понимаю, что если диск плохой, я должен его заменить, но я даже не уверен, какой диск какой. "

Это хороший вопрос. Да, можно тестировать диски независимо, но вы должны отключить питание и разобрать массив, а затем протестировать каждый диск отдельно (желательно в другой системе) без записи каких-либо данных на диск. Когда вы закончите, массив необходимо собрать в том же порядке.

Как узнать, какой диск неисправен в RAID?

Что касается вашего первого вопроса: самый простой способ узнать, какой диск неисправен или имеет ошибки, — обратиться к программному обеспечению вашего жесткого диска RAID и найти диск, который в данный момент восстанавливается. Если одновременно восстанавливается более двух дисков, вам придется обратиться к журналу ошибок RAID, чтобы определить, какой диск выдает вам сообщения об ошибках. Как только вы узнаете, какой диск вызывает проблемы, вам нужно будет выключить систему и отключить ее от массива, чтобы вы могли проверить диск на наличие поверхностных ошибок.

Как найти неисправный диск с помощью RAID-контроллера

Физическое обнаружение неисправного диска, подключенного к вашему RAID-контроллеру, может оказаться сложной задачей.

Когда у меня был проблемный диск, программное обеспечение RAID сообщило, что "диск 0-1" неисправен (это означало, что порт контроллера 0, диск 1). Мой RAID-контроллер имеет 2 порта; каждый порт связан с 4 дисками, всего 8 дисков. Чтобы найти диск, я выключил компьютер, посмотрел на карту контроллера и увидел, что порты контроллера помечены как 0–3 и 4–7 (в данном случае я знал, что 0–3 означает «порт 0», а 4–3). 7 означает «порт 1»). Затем я проследил за отводным кабелем от порта 0 и нашел диск 1. Я знал, что выбрал правильный диск по двум причинам: во-первых, я ранее написал номер диска на жестком диске с помощью перманентного черного маркера, прежде чем построить свой массив; другая причина в том, что на коммутационном кабеле также было написано «p1», поэтому я знал, что «p1» также соответствует правильному диску.

Тестирование жестких дисков независимо от RAID

Невозможно независимо протестировать жесткие диски, если они являются частью массива. Поэтому единственный способ добиться этого — отключить подозрительный диск от массива, затем вставить диск в другой компьютер, а затем выполнить проверку поверхности диска БЕЗ попытки исправить ошибки, так как это приведет к повреждению массива. Для этой задачи я использую Macrorit Disk Scanner, который показывает карту жесткого диска (зеленым цветом) и любые соответствующие поврежденные сектора красным цветом.

Теоретически вы можете отключить все диски от RAID и протестировать их таким образом, но только если:

  • вы не записываете данные на диск после его отключения от массива
  • вы не включаете RAID, пока все диски не будут возвращены в соответствующий порядок

Всегда заменять неисправный диск в массиве идентичным блоком

Невозможно «исправить» жесткий диск с поврежденными секторами, а затем поместить его обратно в массив RAID. Это связано с тем, что список поврежденных секторов хранится в основной загрузочной записи (MBR); если бы вы поместили этот диск обратно в RAID, MBR была бы проигнорирована, поскольку MBR считается как весь RAID, а не как независимый диск, насколько я понимаю.

Стоит также отметить, что на жестких дисках обычно зарезервирована емкость для сбойных секторов, и эти сектора прозрачно используются, когда это необходимо.Если вы тестируете накопитель с помощью программного обеспечения и в нем отображаются поврежденные сектора, это, скорее всего, связано с тем, что ваша зарезервированная емкость уже использована, и накопитель начинает выходить из строя.

Тем не менее, правильный способ справиться с неисправным диском в RAID – это полностью заменить диск идентичным, при условии, что весь массив состоит из одних и тех же жестких дисков.

Что делать с неисправным жестким диском

Если жесткий диск все еще находится на гарантии, вы можете отправить его на замену, и это должен быть первый вариант, который вы должны выбрать, если это возможно.

Если на него не распространяется гарантия, вы можете (а) использовать его независимо от массива и (б) выполнить низкоуровневое форматирование диска, при котором проверяется каждый сектор диска и отображаются поврежденные сектора как он проходит форматирование, затем записывает данные в MBR. На этом этапе вы можете продолжать использовать диск (на свой страх и риск) или вообще прекратить его использование.

Надеюсь, это поможет.

Есть вопрос или проблема с компьютером? Спросите Денниса!

Мне нужно больше вопросов о компьютерах. Если у вас есть вопрос по компьютеру или даже проблема с компьютером, которую нужно решить, пришлите мне свой вопрос по электронной почте, чтобы я мог написать больше статей, подобных этой. Я не могу обещать, что отвечу на все сообщения, которые получу (в зависимости от объема), но сделаю все возможное.

Читайте также: