Утилита диагностики рейдовых массивов

Обновлено: 05.07.2024

Этот раздел посвящен жизни с программной системой RAID, которая взаимодействует с массивами и работает с ними.

Обратите внимание, что когда дело доходит до манипулирования md-устройствами, вы всегда должны помнить, что работаете со всей файловой системой. Таким образом, несмотря на то, что для сохранения ваших файлов может существовать некоторая избыточность, вы должны действовать с осторожностью.

Здесь нет тайны. Достаточно беглого просмотра стандартного журнала и файлов статистики, чтобы заметить сбой диска.

Каталог /var/log/messages всегда должен заполнять экран множеством сообщений об ошибках, независимо от того, что произошло. Но когда речь идет о сбое диска, сообщается об огромном количестве ошибок ядра. Несколько неприятных примеров для мазохистов. Чаще всего сбои дисков выглядят так или так. И, как и ожидалось, классический вид /proc/mdstat также выявит проблемы. Позже в этом разделе мы узнаем, как отслеживать RAID с помощью mdadm, поэтому мы можем получать оповещения о сбоях диска. Теперь пришло время узнать больше об интерпретации /proc/mdstat.

Порядок, в котором устройства отображаются в выходных данных /proc/mdstat, ничего не значит.

Наконец, помните, что вы всегда можете использовать raidtools или mdadm для проверки массивов. Эти команды громко и четко покажут резервные и неисправные диски.

Если вы планируете использовать RAID для обеспечения отказоустойчивости, вы также можете протестировать свою установку, чтобы убедиться, что она действительно работает. Теперь, как смоделировать отказ диска?

Коротко о том, что вы не можете, за исключением, возможно, того, чтобы проткнуть накопитель пожарным топором, на котором вы хотите «симулировать» неисправность. Вы никогда не можете знать, что произойдет, если диск умрет. Он может электрически захватить шину, к которой он подключен, делая все диски на этой шине недоступными. Я никогда не слышал о том, что это происходит, хотя, но это вполне возможно. Диск также может просто сообщить об ошибке чтения/записи на уровень SCSI/IDE, что, в свою очередь, позволит уровню RAID изящно справиться с этой ситуацией. К счастью, так часто бывает.

Помните, что вы должны использовать RAID, чтобы ваш массив мог пережить сбой диска. Линейный или RAID-0 полностью выйдет из строя, если устройство отсутствует.

Принудительный отказ оборудования

Если вы хотите имитировать сбой диска, вы можете просто отключить диск. Вы должны делать это при выключенном питании. Если вы заинтересованы в том, чтобы проверить, могут ли ваши данные сохраниться на диске с меньшим числом, чем обычно, нет смысла быть ковбоем с горячей заменой. Выключите систему, отключите диск и снова загрузите его.

Загляните в системный журнал и загляните в /proc/mdstat, чтобы узнать, как работает RAID. Сработало?

Неисправные диски должны быть отмечены значком (F), если вы посмотрите на /proc/mdstat . Кроме того, пользователи mdadm должны видеть состояние устройства как ошибочное.

Когда вы снова подключите диск (с выключенным питанием, конечно, помните), вы можете снова добавить «новое» устройство в RAID с помощью команды raidhotadd.

Принудительный сбой с помощью программного обеспечения

В новых версиях raidtools есть команда raidsetfaulty. Используя raidsetfaulty, вы можете просто имитировать сбой диска, не отключая его от сети.

Просто запуска команды должно быть достаточно, чтобы вывести из строя диск /dev/sdc2 массива /dev/md1. Если вы используете mdadm, просто введите Теперь все движется вверх, и появляется веселье. Во-первых, вы должны увидеть что-то вроде первой строки в системном журнале. Что-то вроде второй строки появится, если у вас настроены запасные диски. Проверка /proc/mdstat покажет поврежденный массив. Если бы был доступен запасной диск, реконструкция должна была начаться.

Еще одна новая утилита в новейших рейдтулах — lsraid. Попробуйте с пользователями mdadm запустить команду и насладиться просмотром.

Теперь вы видели, что происходит, когда устройство выходит из строя. Давайте все исправим.

Сначала мы удалим неисправный диск из массива. Запустите команду Пользователи mdadm могут запустить команду. Обратите внимание, что raidhotremove не может извлечь диск из работающего массива. По понятным причинам горячим удалением из массива подлежат только битые диски (запуск рейдстопа и размонтирование устройства не поможет).

Теперь у нас есть /dev/md1, который только что потерял устройство. Это может быть поврежденный RAID или, возможно, система, находящаяся в процессе реконструкции. Мы ждем завершения восстановления, прежде чем вернуть все в нормальное состояние.

Поэтому путешествие заканчивается, когда мы отправляем /dev/sdc2 домой. Как обычно, вы можете использовать mdadm вместо raidtools. Это должна быть команда Когда блудный сын вернется в массив, мы увидим, что он станет активным членом /dev/md1, если это необходимо. В противном случае он будет помечен как запасной диск. Управление стало проще.

RAID (будь то аппаратный или программный) предполагает, что если запись на диск не возвращает ошибку, то запись прошла успешно. Поэтому, если ваш диск искажает данные без возврата ошибки, ваши данные будут повреждены.Это, конечно, очень маловероятно, но возможно и приведет к повреждению файловой системы.

RAID не может и не должен защищать от повреждения данных на носителе. Следовательно, также не имеет никакого смысла намеренно повреждать данные (например, с помощью dd) на диске, чтобы посмотреть, как система RAID справится с этим. Скорее всего (если вы не повредите суперблок RAID), уровень RAID никогда не узнает о повреждении, но ваша файловая система на устройстве RAID будет повреждена.

Вот как все должно работать. RAID не является гарантией сохранности данных, он просто позволяет сохранить ваши данные в случае выхода из строя диска (то есть с уровнями RAID выше или равными единице, конечно).

Вы можете запустить mdadm в качестве демона, используя режим Follow-Monitor. При необходимости это заставит mdadm отправлять оповещения по электронной почте системному администратору, когда массивы обнаруживают ошибки или сбои. Кроме того, режим отслеживания можно использовать для запуска команд на случай непредвиденных обстоятельств в случае сбоя диска, например, дать второй шанс неисправному диску, удалив и повторно вставив его, чтобы можно было автоматически устранить нефатальный сбой.

Давайте рассмотрим простой пример. Запуск должен выпустить демон mdadm для мониторинга /dev/md2. Параметр задержки означает, что опрос будет производиться с интервалом в 1800 секунд. Наконец, о критических событиях и фатальных ошибках следует сообщать системному администратору по электронной почте. Мониторинг RAID стал проще.

Наконец, параметры --program или --alert указывают программу, которая будет запускаться при обнаружении события.

Обратите внимание, что демон mdadm никогда не завершит работу, если решит, что есть массивы для мониторинга, поэтому обычно его следует запускать в фоновом режиме. Помните, что вы запускаете демон, а не команду оболочки.

Использование mdadm для мониторинга массива RAID просто и эффективно. Однако с таким мониторингом возникают фундаментальные проблемы — что произойдет, например, если демон mdadm остановится? Чтобы преодолеть эту проблему, следует искать «настоящие» решения для мониторинга. Существует ряд бесплатных программ с открытым исходным кодом и коммерческих решений, которые можно использовать для мониторинга программного RAID в Linux. Поиск на FreshMeat должен дать достаточное количество совпадений.

Кто-нибудь знает какое-нибудь хорошее бесплатное ПО для диагностики двух жестких дисков в зеркале RAID 1?

К сожалению, на машине не было встроенных средств диагностики, поэтому мне нужно найти что-то для проверки дисков, потому что один из них, похоже, умирает, но не то, что вызывает сбой рейда

Ксилемс92

Этот человек является проверенным специалистом

Ксилемы92

Популярные темы в области хранения данных

19 ответов

tbasham_ms

Этот человек является проверенным специалистом

tbasham_ms

Обычно производители компьютеров/серверов или дисков сами предоставляют инструменты диагностики (как правило, даже бесплатные).

я снова

Как называется производитель? У некоторых производителей, таких как readynas, есть собственное программное обеспечение, по которому можно увидеть, какой диск вышел из строя

JCantrell

Это рабочая станция или сервер? Если это рабочая станция, я бы вернул BIOS в режим AHCI (это не приведет к потере данных), а затем использовал бы дистрибутив Linux, установленный на загрузочный USB-накопитель, для проверки дисков SMART. Я делал это раньше и выявлял умирающие диски в массиве, поскольку большинство (все?) RAID-контроллеры класса рабочих станций не позволяют вам SMART проверять отдельные диски.

stefuk

Этот человек является проверенным специалистом

стефук

Это аппаратный RAID или программный RAID? Если это программное обеспечение, вам не нужно беспокоиться о том, что они находятся в RAID, потому что ОС по-прежнему может видеть диски, и нормальная функциональность SMART должна быть там, как обычно.

Если это аппаратный RAID, вы не сможете сделать то, что хотите. Диски абстрагируются контроллером и не подвергаются воздействию ОС. Вы можете видеть только ту диагностическую информацию, которую RAID-контроллер решил предоставить вам.

Ксилемс92

Этот человек является проверенным специалистом

OP Xylems92

JCantrell: Я знаю, что возврат к AHCI не приведет к потере данных, однако после того, как я протестирую диски, воссоздание RAID приведет к их очистке. Да, я знаю, какой диск я потерял, но все данные ушли с ним, что привело к потере данных. рейд бесполезен? лол

Похоже, мне придется поменять один из двух, и я надеюсь, что вытащу плохой диск, я полагаю, ха-ха. Это аппаратный RAID.

Xylems92 написал:

JCantrell: Я знаю, что возврат к AHCI не приведет к потере данных, однако после того, как я протестирую диски, воссоздание RAID сотрет диски, да, я знаю, что диск я потерял, но все данные ушли с ним, что делает рейд бесполезным? lol

Спасибо, СЭМ,

Похоже, мне придется поменять местами один из двух и надеюсь, что я вытащу плохой диск, я полагаю, ха-ха. Это аппаратный RAID.

Ни один индикатор не загорается? По крайней мере, это RAID 1, так что выдергивание диска не уничтожит данные.

Ксилемс92

Этот человек является проверенным специалистом

OP Xylems92

Никаких огней.

Randy926

поэтому поставщики жестких дисков отключают программное обеспечение для этой функции независимо от марки/модели дисков.

Ксилемс92

Этот человек является проверенным специалистом

OP Xylems92

Нашел решение моей проблемы. Я просто выдернул один диск, ухудшил RAID и запустил Check Disk. Ошибка.

Подключил отключенный и отключил противоположный. запустил проверку диска. Пройдено

Взял 1-й диск, провел дальнейшую диагностику с помощью док-станции Sata на другом ПК.

10 тестов не пройдены.

Жесткий диск превратился в маленький куб, лол

JCantrell

Xylems92 написал:

JCantrell: Я знаю, что возврат к AHCI не приведет к потере данных, однако после того, как я протестирую диски, воссоздание RAID сотрет диски, да, я знаю, что диск я потерял, но все данные ушли с ним, что делает рейд бесполезным? лол

Нет, ваши данные не исчезнут. Массив останется нетронутым, так как диски по-прежнему помечены. Таким образом, вы возвращаетесь к AHCI, тестируете, затем снова устанавливаете RAID, и все как было, повторная инициализация RAID не требуется. Я делал это несколько раз с RAID-контроллерами Intel для рабочих станций, отлично работает для поиска неисправностей.

РЕДАКТИРОВАТЬ: Или просто делайте то, что вы делали, это тоже работает. Менее рискованно не ухудшить состояние RAID и сделать это с помощью моего метода, но для этого вам нужно перевести систему в автономный режим.

EngineerIT

Скотт Алан Миллер писал:

Это аппаратный RAID или программный RAID? Если это программное обеспечение, вам не нужно беспокоиться о том, что они находятся в RAID, потому что ОС по-прежнему может видеть диски, и нормальная функциональность SMART должна быть там, как обычно.

Если это аппаратный RAID нет возможности делать то, что вы хотите.Диски абстрагируются контроллером и не подвергаются воздействию ОС. Вы можете видеть только ту диагностическую информацию, которой RAID-контроллер решил поделиться с вами.

KOOLER ( СтарВинд)

Этот человек является проверенным специалистом

КУЛЕР (StarWind)

Представитель бренда StarWind

Xylems92 написал:

Привет всем,

Кто-нибудь знает какое-нибудь хорошее бесплатное программное обеспечение для запуска диагностики на двух жестких дисках в зеркале рейда 1?

p>

К сожалению, машина не поставлялась с какой-либо встроенной диагностикой, поэтому мне нужно найти что-то для проверки дисков, потому что один из них, похоже, умирает, но не что-то, что вызывает фактический сбой рейда

< p>Спасибо!

Хотите ли вы прочитать статус SMART (практически бесполезно) или вы хотите запустить сканирование поверхности?

Джон Уайт

Этот человек является проверенным специалистом

Джон Уайт

Действительно ли RAID-контроллер не подавал никаких указаний? Что это за система? RAID-контроллер?

Пол - Дейл Компьютерные Услуги

Dale Computer Services — поставщик ИТ-услуг.

Я только что нашел этот инструмент. Утверждает, что проводит тест SMART и сканирование поверхности. Вроде без вирусов. У меня есть диск в конфигурации рейда, который мне нужно протестировать. Я буду следить за своими выводами.

Поддержка RAID и поддержка аппаратного RAID — две разные вещи. Если вы делаете программный RAID, любой инструмент должен видеть данные SMART. Если вы делаете аппаратный RAID, этот инструмент не должен работать. Ничто на сайте не заставляет меня думать, что он поддерживает любой аппаратный RAID.

Пол - Дейл Компьютерные Услуги

Dale Computer Services — поставщик ИТ-услуг.

Как оказалось, hddscan показывает некоторую интересную информацию о производительности, но, похоже, не выполняет никакой полезной диагностики аппаратного рейда.

Paul - Dale Computer Services пишет:

Как оказалось, hddscan показывает интересную информацию о производительности, но, похоже, не выполняет никакой полезной диагностики аппаратного рейда.

< /цитата>

Это физически невозможно увидеть сквозь абстракцию RAID :) Физические диски на самом деле в некоторой степени отделены от самой системы воздушным зазором. Материнская плата ни при каких условиях не может взаимодействовать с дисками.

Привет! Извините, что влезаю в это, но я надеялся, что кто-нибудь укажет мне правильное направление.

У меня рейд 10 с картой 3ware. Все оборудование совершенно новое. Рейд и все диски отображаются как «ОК», но два из моих дисков отображаются с красными мигающими индикаторами.

Я переустановил карту, кабели разветвления и диски, но проблема осталась.

Я обновил прошивку карты до последней и лучшей версии, но после перезагрузки проблема не исчезла.

Я полагаю, что у меня установлена ​​последняя версия драйвера, судя по тому, что я вижу на странице драйверов 3wares

Я попытался пересобрать каждый из двух дисков по отдельности, но проблема осталась.

Что вы рекомендуете запустить, чтобы обнаружить проблему с двумя "проблемными дисками"?

Как это возможно, что с дисками все в порядке, но система считает, что это проблема?

Эта тема заблокирована администратором и больше не открыта для комментариев.

Чтобы продолжить это обсуждение, задайте новый вопрос.

Искра! Серия Pro — 28 марта 2022 г.

Прекрасный понедельник! С возвращением на работу и с возвращением в Spark! Я надеюсь, что ваш день превратится во все, что может быть! В любом случае, сделайте селфи и опубликуйте его ниже. Просто напоминание, если вы читаете.

Странные маршруты в таблице маршрутизации

Привет, ребята! Итак, у меня есть вопрос относительно некоторых действительно странных маршрутов в моей таблице маршрутизации. Недавно я перевел свой маршрутизатор Huawei B818 4G в режим моста за pfSense, который теперь является моим основным маршрутизатором. При этом я замечаю эти статические записи, которые появляются и.

Сколько ИБП у вас дома?

Я просто осматривал аккумуляторы (на предмет вздутия и уменьшения времени автономной работы) и решил, что пришло время спросить: Сколько у вас дома? Я запускаю (все APC, потому что это просто «случилось»), лол): 1500 ВА в подвале 2. - разместить стойку Chatsworth 650 в моем домашнем офисе 600 в офисе жены.

Что бы вы сделали?

Итак, я работаю в MSP, который работает круглосуточно и без выходных. Старший инженер в нежелательную смену с 23:00 до 8:00 уходит. Теперь у меня есть возможность перейти на эту должность, насколько больше это потребует компенсации в процентах от того, что я зарабатываю сейчас? и я скажу это.

Очень необычный спам. Ответить на темы + ссылка OneDrive + файл PWD

Поэтому я недавно заметил резкое увеличение входящего спама и заметил очень необычный новый спам. Он имеет несколько очень специфических характеристик, которые отличают его от обычных спам-сообщений: 1 – он содержит настоящие цепочки ответов по электронной почте2 – он содержит настоящие имена.

Восстановление данных RAID с годами становится все более сложным. С появлением персональных компьютеров, которые теперь поставляются с нулевым RAID по умолчанию, карты RAID становятся чрезвычайно доступными, а некоторые операционные системы предлагают менеджеры файловых систем, которые позволяют создавать конфигурации RAID, для этого технического специалиста стало очевидным, что какая-то помощь в конце пользователь в порядке. Мы больше не можем предполагать, что RAID предназначены только для крупных корпораций, потому что их потребности в данных отличаются от потребностей домашнего пользователя. На самом деле дело в том, что World of Warcraft от Blizzard будет работать лучше при нулевой конфигурации RAID, чем при стандартной конфигурации с одним диском, поскольку игра требует больших дисковых ресурсов. RAID Zero предназначен для увеличения пропускной способности дисков и, таким образом, для улучшения игрового процесса.

При этом какой инструмент есть у конечного пользователя, чтобы помочь ему с капризным RAID? Инструмент должен иметь возможность во-первых, найти проблему с их RAID, и во-вторых, определить, какие шаги они могут предпринять для восстановления своих данных из этого массива. Восстановление данных для массива чрезвычайно дорого, и цена находится в пределах от 1500,00 до 2000,00 долларов США за диск в массиве. Однако, если конечный пользователь может определить свою проблему и четко связать ее с техническим специалистом, это может снизить затраты. Я знаю, что сам разработал специальные пакеты с конечными пользователями, если они помогают в работе и берут на себя некоторые риски. Более восьмидесяти процентов RAID, над которыми я работаю, никогда не видели физической лаборатории. Я использую свой собственный набор программных инструментов, а также свой собственный опыт для восстановления RAID, с которыми я работаю.

Теперь я предлагаю вам тот же набор инструментов. Я разрабатываю, программирую и реализую набор инструментов для восстановления данных, которые каждый может использовать для диагностики неисправного RAID-массива. Этот набор инструментов будет отражать мой набор, который я использую здесь каждый день. На самом деле, я в конечном итоге буду использовать этот инструмент в качестве своего повседневного средства восстановления, поскольку будут улучшения, которые я всегда хотел добавить в программное обеспечение, но никогда не было времени. Поскольку этот проект стал приоритетным, теперь я могу посвятить время созданию очень полного комплекта средств диагностики RAID.

Программное обеспечение будет выпускаться частями. Когда я закончу новую функцию, я обновлю программное обеспечение, обновлю этот блог с объяснением функции и предложу еще один пост, объясняющий, как новая функция используется в контексте сценария реальной жизни. Я надеюсь каждую неделю вводить новую функцию.

Его можно бесплатно загрузить с веб-сайта, и я также предложу ограниченный объем бесплатной технической поддержки. Я хотел бы оговориться в этом утверждении, сказав, что я определю значение слова «ограниченный». Видите ли, я должен время от времени сдерживать свое любопытство, поскольку каждая новая проблема, с которой вы, мои конечные пользователи, сталкиваетесь, предлагает замечательную возможность разгадать тайну и, в конечном счете, помочь вам вернуть свои данные. Любопытство, может быть, и сгубило кошку, но оно не дает мне спать по ночам!

Руководство по набору инструментов для восстановления данных RAID

Набор функций для первого предложения RAID Diagnostic Toolkit очень прост. В этом посте объясняется, как выбрать набор «потоков» для создания «набора RAID». Изначально программа не имеет каких-либо опций для размера полосы, типа рейда, смещения метаданных и т. д. и т. п. Для функции «проверки четности», которую предлагает эта текущая версия этого программного обеспечения, предполагается, что будет RAID 5 с размером полосы 64 КБ без метаданных. В будущих версиях программного обеспечения эти и многие другие параметры будут добавлены, чтобы сделать инструмент диагностики более надежным.

Сначала мы должны заполнить RAID потоками. В основном есть два типа потоков, которые мы будем использовать, первый — это физический поток данных или «жесткий диск». Второй — это поток данных изображения или «файл». На рисунке A показано заполнение «списка потоков» физическими потоками. Как видите, пункт меню «Заполнить список потоков» выделен.Нажав на нее, вы опросите все жесткие диски на локальном компьютере и отобразите их, как показано на рисунке B.

Лучший способ протестировать массив — создать образы жестких дисков, а затем использовать эти образы для тестирования. В пункте меню «Конфигурация» нажмите «Добавить файловый поток в список». Появится стандартное диалоговое окно выбора файла Windows. Перейдите в нужную папку и выберите изображение, которое вы хотите добавить в список потоков. Нажмите на файл, а затем откройте, и файл будет добавлен в ваш список потоков. Теперь вы можете добавить этот элемент в свой список конфигурации RAID.

Чтобы добавить элемент из списка потоков в конфигурацию RAID, просто дважды щелкните элемент списка потоков, и он будет добавлен в список элементов конфигурации RAID, как показано на рисунке C.

Далее, чтобы запустить проверку на четность, нажмите на пункт меню «Диагностика». При этом откроется пункт меню «Проверка четности Raid Five». Нажмите на этот пункт меню, и начнется диагностика. Эта функция будет проверять RAID 5 по полосе за полосой и проверять четность с помощью XOR.

В нижнем левом углу программного обеспечения находится небольшое окно состояния/информации, которое предлагает данные сканирования четности в реальном времени. это окно содержит пять элементов, описывающих состояние диагностики.

Тип: настроенный тип RAID/River

Ident: Идентификатор, присвоенный типу RAID/River

Блок: Блок, который в данный момент сканируется программой

Время: время, оставшееся до завершения сканирования.

Ошибки: общее количество блоков, в которых обнаружена ошибка четности.

Два из пяти элементов наиболее важны для этой конкретной функции. Это пункт «Ошибки» и пункт «Блокировать». Если элемент «Ошибка» составляет от десяти до пятнадцати процентов массива, вероятно, полоса массива повреждена, и у вас может быть устаревший диск в массиве. Однако для всех практических целей должно быть меньше или всего три или четыре полных ошибки для всего массива. Исправный массив не будет иметь ошибок, и если появится хотя бы одна, это может означать, что либо аппаратное обеспечение начинает сбоить, либо, что еще хуже, прошивка или сопровождающая ее память содержат ошибки. Любой сценарий может привести к катастрофе для вашего массива, и на него следует обратить внимание немедленно. Посмотрите на рисунок D в качестве примера.

Наконец, если вы хотите прервать диагностику, просто щелкните пункт меню «Конфигурация», а затем пункт «Прервать обработку», и вся обработка будет остановлена.

Вот оно! Конечно, вы всегда должны помнить, что даже если RAID не проходит тест на четность, все еще могут быть данные для восстановления. В качестве альтернативы, если он проходит, это не обязательно означает, что RAID подходит для перестроения. В программное обеспечение будут добавлены другие функции, которые помогут вам лучше определить, целесообразна ли перестройка. Если возможно, всегда рекомендуется создать образ каждого члена RAID перед перестроением.

linkdin

Написано Манси Верма

linkdin

Одобрено Рохитом Арора

Обновлено 19 января 2022 г.

Чтение мин. 5 мин.

Непрерывный мониторинг работоспособности RAID — это лучший способ, чем периодическая проверка работоспособности дисков. Потому что с проверкой диска на основе интервалов вы не сможете отследить проблемы с работоспособностью диска, которые возникли на неконтролируемой фазе. Это означает, что обнаружение проблемы происходит с задержкой по сравнению с фактическим моментом ее возникновения.

Давайте подробно рассмотрим этот сценарий:

Администраторы часто жалуются на сбой конфигурации RAID из-за повреждения диска, несмотря на регулярный мониторинг состояния и конфигурации жесткого диска. Дело в том, что «периодического» мониторинга работоспособности недостаточно, так как периода времени между двумя проверками может быть достаточно, чтобы повредить диск и повлиять на весь RAID.


Этой ситуации можно легко избежать, если принять меры и следить за состоянием работоспособности жесткого диска RAID в Windows.

Важным моментом является то, что проверка жесткого диска (даже если она выполняется через регулярные промежутки времени) не обеспечивает круглосуточный мониторинг гаджета. Следовательно, если авария обрушится на жесткий диск на неконтролируемой фазе, результаты не будут отображаться до следующей проверки или возникновения функциональной проблемы. Таких аварий легко избежать с помощью программного обеспечения для мониторинга жестких дисков RAID.

Как контролировать состояние работоспособности жесткого диска RAID?

Существует несколько способов мониторинга жестких дисков:

  • Инструменты мониторинга от производителей жестких дисков:

Производители жестких дисков предоставляют собственные средства мониторинга для отслеживания состояния и производительности жестких дисков. Вот как вы можете найти и использовать утилиту мониторинга для вашего жесткого диска -


  • Узнайте марку и номер модели жесткого диска.
  • Перейдите на страницу поддержки жесткого диска на сайте производителя и найдите утилиту жесткого диска.
  • Активируйте диагностические функции жесткого диска, чтобы проверить его работоспособность на основе технологии самоконтроля, анализа и отчетности или технологии S.M.A.R.T. атрибуты.

Встроенный инструмент Windows сканирует диски для обнаружения системных ошибок. Команда CHKDSK также помогает при проблемах с жестким диском. Встроенный инструмент сканирует и устраняет проблемы, если это возможно, или сообщает о них. Регулярные проверки помогают смягчить проблемы, связанные с плохим состоянием диска.


< /p>

WMIC – это интерфейс командной строки для мониторинга S.M.A.R.T. атрибуты жесткого диска. Он предоставляет простой вывод в виде «ОК» или «Pred Fail». Эта встроенная функция представляет собой базовую команду и предоставляет только ограниченную информацию.


< /p>

  • Опция «Мониторинг диска» программного обеспечения Stellar Data Recovery Technician

Stellar Drive Monitor, который поставляется вместе с многофункциональным программным обеспечением для восстановления RAID, представляет собой монитор диска в режиме реального времени, помогает отслеживать несколько параметров жесткого диска, и когда какой-либо отслеживаемый атрибут превышает пороговое значение, приложение отображает предупреждение.


< бр />

Программное обеспечение позволяет пользователям выбирать диск из RAID-диска для проверки состояния выбранного диска.

Почему стоит выбрать монитор SMART Drive?

<р>1. Инструмент для жесткого диска производителя зависит от бренда. Монитор диска Samsung контролирует только устройства Samsung. Самсунг не может наблюдать диски других марок. Также, если вместе с диском Samsung установлен диск какой-либо другой марки, то другой диск не может быть отслежен, так как система не позволяет загрузить монитор диска для другой марки или марки.

<р>2. CHKDSK и WMIC являются инструментами проверки и не предоставляют полную информацию о состоянии диска.

<р>3. Установить и запустить Stellar Drive Monitor в Windows 10 очень просто. После активации S.M.A.R.T. программное обеспечение можно использовать для мониторинга различных атрибутов жесткого диска, таких как состояние диска, интеллектуальное состояние, раздел диска, сканирование диска и клонирование диска.



Он отслеживает физическое состояние диска — температуру, работоспособность и производительность диска. Пользователи могут определить порог и критический предел для приложения. Любое отклонение от нормы иллюстрируется цветом, где синий соответствует идеалу, оранжевый — приемлемому, а красный — худшему. Большинство пользователей принимают меры, как только состояние диска начинает отображаться оранжевым цветом, и защищают работоспособность жесткого диска RAID, действуя упреждающе.

Этот модуль измеряет коэффициент пригодности диска и определяет состояние атрибутов. Пороговое значение отображает предел, выше которого диск может выйти из строя. Stellar Drive Monitor отображает пороговое значение, чтобы помочь сохранить диск и RAID от поломки.

Он отслеживает все разделы на диске и отображает состояние раздела, состояние каждого раздела и доступное пространство. Системные администраторы могут судить о состоянии и объеме памяти по доступным значениям.

Определяет и отображает поврежденные сектора на диске. Если количество поврежденных секторов велико, рекомендуется заменить диск.

Этот процесс помогает скопировать все данные с исходного диска на доступный целевой диск, сохраняя при этом данные исходного диска.

В целом упреждающее функционирование Drive Monitor помогает пользователям отслеживать состояние здоровья жестких дисков RAID и защищает их от нежелательной потери данных.

Вывод

Организации принимают ряд мер для защиты своих данных — наиболее важного компонента. Одной из таких мер является использование конфигурации RAID на дисках. Устройства хранения с конфигурацией RAID также помогают повысить производительность и отказоустойчивость. Поскольку в конфигурации RAID задействовано множество дисков, крайне важно следить за состоянием отдельных жестких дисков и избегать ситуаций потери данных.

Развертывание Drive Monitor для проверки состояния работоспособности жесткого диска RAID в Windows позволяет отслеживать работоспособность и производительность дисков и заранее принимать соответствующие меры.

HDDScan – это бесплатное программное обеспечение для диагностики жестких дисков (также поддерживаются серверы RAID-массивов, флэш-накопители USB и SSD). Программа умеет тестировать накопитель на ошибки (Bad-блоки и битые сектора), показывать S.M.A.R.T. атрибуты и изменить некоторые параметры жесткого диска, такие как AAM, APM и т. д.

Сбой жесткого диска?

Если ваше устройство издает какой-либо ненормальный шум, немедленно прекратите его, не пытайтесь включить устройство и обратитесь в профессиональную компанию по восстановлению данных.

Служба восстановления данных DigiLab рекомендована и одобрена разработчиками утилиты HDDScan.

Image

HDDScan может быть полезен для проведения регулярного «проверки работоспособности» вашего диска и прогнозирования его деградации, поэтому вы сможете предотвратить потерю данных и создать резервную копию своих файлов, прежде чем вам придется обращаться в службу восстановления данных.
Кроме того, программное обеспечение можно использовать в качестве монитора температуры жесткого диска и бенчмарка чтения/записи — для каждого теста отображается график производительности.

Возможности и требования:

Поддерживаемые устройства хранения:

  • Жесткий диск IDE (ATA) и SATA.
  • Жесткий диск SCSI (SAS).
  • Внешние USB-накопители и все основные USB-боксы (см. Приложение A).
  • Жесткий диск FireWire или IEEE 1394 (см. Приложение A).
  • Тома RAID, состоящие из жестких дисков ATA (IDE)/SATA/SCSI (только поверхностные тесты).
  • USB-флэш-память (флэш-накопители) — только поверхностные тесты.
  • SATA/ATA SSD — твердотельные накопители.

Тесты устройств хранения:

  • Проверка в линейном режиме — самый быстрый способ определить, нуждается ли ваш диск в восстановлении данных, есть ли устранимые ошибки или он находится в идеальном состоянии.
  • Чтение в линейном режиме — то же, что и проверка, но также передача данных на хост.
  • Стирание в линейном режиме.
  • Чтение в режиме "бабочка" (синтетическое случайное чтение).
  • Чтение и анализ параметров SMART с жесткого диска ATA/SATA/USB/FireWire.
  • Чтение и анализ страниц журнала с жесткого диска SCSI.
  • Проверки SMART выполняются на жестких дисках ATA/SATA/USB/FireWire.
  • Монитор температуры жесткого диска ATA/SATA/USB/FireWire/SCSI.
  • Чтение и анализ идентификационной информации с жесткого диска ATA/SATA/USB/FireWire/SCSI.
  • Изменение параметров AAM, APM, PM на жестком диске ATA/SATA/USB/FireWire.
  • Сообщение информации о дефектах жесткого диска SCSI.
  • Функция запуска/остановки шпинделя на жестких дисках ATA/SATA/USB/FireWire/SCSI.
  • Отчеты можно сохранять в формате MHT.
  • Отчеты можно распечатать.
  • Поддержка командной строки.
  • Отчеты SSD SMART и Identity.
  • Windows XP SP3, Windows Server 2003 (с ограничениями), Windows Vista, Windows 7, Windows 8, Windows 10.
  • Программу нельзя запускать с устройства/носителя только для чтения.

Пользовательский интерфейс

  • Раскрывающийся список «Выбрать диск» — содержит список поддерживаемых в системе устройств хранения данных. Список содержит модели и серийные номера устройств. Значок определяет возможный тип хранилища.
  • S.M.A.R.T. кнопка – генерирует S.M.A.R.T. отчет по атрибутам.
  • Кнопка TESTS — показывает всплывающее меню для выбора тестов чтения и записи.
  • Кнопка «ИНСТРУМЕНТЫ» — отображает всплывающее меню для выбора доступных элементов управления и функций накопителя.
  • Кнопка «Дополнительно» — показывает раскрывающееся меню с элементами управления программой.
  • Раскрывающийся список «Выбрать диск» — содержит список поддерживаемых в системе устройств хранения данных. Список содержит модели и серийные номера устройств. Значок определяет возможный тип хранилища.
  • S.M.A.R.T. кнопка – генерирует S.M.A.R.T. отчет по атрибутам.
  • Кнопка TESTS — показывает всплывающее меню для выбора тестов чтения и записи.
  • Кнопка «ИНСТРУМЕНТЫ» — отображает всплывающее меню для выбора доступных элементов управления и функций накопителя.
  • Кнопка «Дополнительно» — показывает раскрывающееся меню с элементами управления программой.

Когда вы нажимаете кнопку ТЕСТ, всплывающее меню предлагает вам один из тестов. Если выбрать любой тест – откроется диалог выбора теста.

Когда вы нажимаете кнопку ИНСТРУМЕНТЫ, всплывающее меню предлагает вам выбрать один из следующих вариантов.

  • DRIVE ID – создает отчет с идентификационной информацией.
  • FEATURES — открывает управление функциями ATA или SCSI.
  • S.M.A.R.T. ТЕСТ – активирует диалог с Коротким, Расширенным и Транспортным S.M.A.R.T. тесты.
  • TEMP MON — запускает задачу мониторинга температуры.
  • КОМАНДА – открывает диалоговое окно, в котором можно построить командную строку для программы.
Диалоговое окно выбора теста
  • ПЕРВЫЙ СЕКТОР – определяет адрес первого логического блока (LBA) для тестирования.
  • SIZE — количество LBA для этого теста.
  • BLOCK SIZE – указывает размер блока для тестирования (в секторах LBA).
  • Кнопка «Назад» — возвращает программу на главный экран.
  • Кнопка «Далее» — добавляет тест в очередь задач.
Диалоговое окно выбора теста

Тестирует возможности и ограничения:

  • Только один тест за раз. Автору не удалось получить стабильные результаты двух или более одновременных тестов.
  • Проверочный тест может иметь ограничения на размер блока с 256, 16 384 или 65 536 секторов из-за ограничений Windows.
  • Проверка может работать ненадежно на устройствах USB/Flash.
  • В режиме проверки устройство считывает блок данных только во внутренний буфер накопителя и проверяет целостность, передача данных через интерфейсный разъем/кабель не осуществляется. Программа измеряет время работы для каждого блока. Программа тестирует блоки один за другим от минимума к максимуму.
  • В режиме чтения устройство считывает блок данных и передает его через интерфейс на хост-контроллер. Программа считывает блок данных во временный буфер и измеряет время работы для каждого блока. Программа тестирует блоки один за другим от минимума к максимуму.
  • В режиме стирания программа подготавливает блок поля данных со специальным шаблоном и номером LBA. Программа отправляет блок данных на накопитель и накопитель записывает блок (Все предыдущие данные в блоке на накопитель будут перезаписаны шаблоном и не могут быть восстановлены после этого!) Программа измеряет время работы для каждого блока. Программа тестирует блоки один за другим от минимума к максимуму.
  • Режим чтения бабочки аналогичен режиму чтения, разница только в порядке блоков. Блоки проверяются парами. Первым блоком в первой паре будет Блок 0, вторым блоком в первой паре будет Блок N (где N — номер последнего блока для тестирования). Следующая пара будет Блок 1 и Блок N-1. Тест заканчивается в середине тестовой зоны. Программа измеряет время работы.
Окно диспетчера задач

В этом окне показана очередь задач. Все тесты поверхности, S.M.A.R.T. тесты и задачи мониторинга температуры будут отображаться в окне диспетчера задач.

Двойной щелчок по строке задачи откроет окно с информацией о задаче (в качестве альтернативы вы можете выбрать пункт «Показать подробности» в меню «Диспетчера задач»).

Окно тестовой информации

Это окно содержит информацию о выбранном тесте. Тест может быть приостановлен или остановлен, а отчет с результатами может быть сгенерирован.

Вкладка "График":
отображает скорость тестирования для каждого блока. Информация представлена ​​в виде графика.

Окно тестовой информации

Это окно содержит информацию о выбранном тесте. Тест может быть приостановлен или остановлен, а отчет с результатами может быть сгенерирован.

Вкладка "Карта":
отображает время отклика для каждого блока. Информация представлена ​​в виде карты.

Вы можете выбрать "Время обработки блока" в миллисекундах. Каждый протестированный блок, для которого потребовалось бы больше времени, чем «Время обработки блока», будет зарегистрирован на вкладке «Отчет».

Окно тестовой информации

Это окно содержит информацию о выбранном тесте. Тест может быть приостановлен или остановлен, а отчет с результатами может быть сгенерирован.

Вкладка «Отчет»:
содержит информацию о выбранном тесте и каждом протестированном блоке на диске, время отклика которого превышает «Время обработки блока».

Идентификационные данные

Отчет содержит информацию о физических и логических параметрах жесткого диска. Отчет можно сохранить в файл MHT.

S.M.A.R.T. отчет

Отчет содержит информацию о производительности и «здоровье» диска, описанную в атрибутах. Зеленый значок означает, что значения атрибутов в норме. Желтым значком отмечены важные атрибуты, которые могут указывать на неисправность жесткого диска. Красный значок указывает на ненормальные значения атрибутов.

Отчет можно сохранить в файл MHT.

Температурный монитор

Монитор позволяет оценить температуру жесткого диска. Температура отображается на панели задач и в информационном окне.

Монитор температуры жесткого диска ATA/SATA

Для дисков ATA/SATA/USB/FireWire в окне информации отображаются два значения. Второе значение отображается на панели задач и представляет температуру из атрибута температуры HDA.

Первое значение указывает температуру из атрибута Airflow Temperature.

Если второе значение не поддерживается для диска, первое значение будет отображаться на панели задач.

Монитор температуры жесткого диска SCSI

Для дисков SCSI в информационном окне отображаются два значения. Второе значение отображается на панели задач и представляет собой текущую температуру.

Первое значение указывает максимально допустимую температуру жесткого диска.

S.M.A.R.T. тесты

Программа может запускать три типа тестов:

  • Короткий тест - длится около 1-2 минут.Тест проверяет основную электронику накопителя, сканирует небольшую часть поверхности накопителя и проверяет сектора из Pending-list (такие сектора могут иметь ошибки чтения). Этот тест рекомендуется для быстрого тестирования диска.
  • Расширенный тест: может занять от 0,5 до 60 часов в зависимости от размера диска. Тест проверяет основную электронику накопителя и сканирует всю поверхность накопителя.
  • Проверка переносимости — обычно длится несколько минут. Тест проверяет основную электронику привода и журналы, в которых могут быть записи, указывающие на неправильную транспортировку или хранение.

Тест SMART можно выбрать в диалоговом окне тестов SMART, которое можно вызвать, нажав кнопку SMART TESTS

S.M.A.R.T. тесты

После выбора тест будет добавлен в очередь задач.

В окне сведений о тестах SMART может отображаться ход выполнения и статус завершения.

Возможности

Программа может изменять некоторые параметры для жестких дисков ATA/SATA/USB/FireWire:

  • AAM - эта функция изменяет акустику привода. Если эта функция включена, шум накопителя может быть уменьшен за счет сглаживания операций поиска HSA. Жесткий диск может немного снизить производительность.
  • APM — эта функция позволяет экономить электроэнергию за счет временного снижения скорости вращения шпинделя (включая полную остановку), когда привод находится в режиме ожидания.
  • PM - эта функция позволяет установить таймер замедления вращения. Если привод находится в режиме ожидания, шпиндель будет остановлен по истечении времени, установленного в таймере. Если какая-либо программа запросит доступ к жесткому диску, внутренний таймер будет сброшен, а шпиндель продолжит вращение.
  • Программа также может немедленно запускать или останавливать шпиндель. Если какая-либо программа запросит доступ к жесткому диску, шпиндель диска раскрутится.
Возможности

Для дисков SCSI/SAS/FC программа может отображать списки дефектов и запускать или останавливать шпиндель.

Диалог командной строки

HDDScan может создать командную строку и сохранить ее в файле .cmd или .bat. При запуске такого файла программа запускается в фоновом режиме, меняет выбранные параметры и автоматически закрывается.

Приложение A. Жесткие диски USB и FireWire

Если жесткий диск USB/FireWire поддерживается программой, тесты S.M.A.R.T. возможности и дополнительные функции могут быть выполнены на диске.

Если USB/FireWire HDD не поддерживается программой, можно выполнять только тесты.

Жесткие диски USB/FireWire, поддерживаемые программой:
td>
Устройство хранения данных Чип контроллера
Все накопители, поддерживающие протокол SAT Большинство современных USB-контроллеров
StarTeck IDECase35U2 Cypress CY7C68001
Варьируется< /td> Cypress CY7C68300B
Варьируется Cypress AT2LP RC7
ВарьируетсяJMicron JM2033x
Варьируется Prolific PL2507
Варьируется Prolific PL3507
Варьируется Prolific 2571
Варьируется SunPlus SPIF215A
Варьируется Встроенный ISD300A
Жесткие диски USB/FireWire, не поддерживаемые программой:
< tr>

Приложение Б: поддерживаемые твердотельные накопители

Поддержка любого конкретного твердотельного накопителя в основном зависит от его контроллера SSD.

Твердотельные накопители, поддерживаемые HDDScan:
Устройство хранения Чип контроллера
Варьируется Genesis Logic GL811E
Iomega DHD160-U Prolific PL-2507 (модифицированная прошивка)
Iomega , Maxtor Prolific PL-3507 (модифицированная прошивка)
Варьируется Cypress CY7C68013
Варьируется Cypress CY7C68300A
Варьируется Myson Century CS8818
< td>Corsair Extreme Series td>
Модель SSD-накопителя Чип контроллера SSD
OCZ Vertex, Vertex Turbo, Agility , Solid 2 Indilinx IDX110M00
Super Talent STT_FTM28GX25H Indilinx IDX110M00
Indilinx IDX110M00
Kingston SSDNow серии M Intel PC29AS21AA0 G1
Intel X25-M G2 Intel PC29AS21AA0 G2
Варьируется JMicron JMF601
Варьируется Дроссель OCZ
Corsair Performance Series Samsung S3C29RBB01
Твердотельные накопители Samsung Контроллеры Samsung
Твердотельные накопители Crucial и Micron Контроллеры Marvell
Твердотельные накопители потенциально поддерживаются HDDScan:
< /tbody>
Модель SSD-накопителя Чип контроллера SSD
OCZ Vertex2, Agility2 SandForce SF1200
OCZ Vertex LE, Vertex 2 Pro SandForce SF1500
Corsair Force F100 Series SandForce SF1200
Все твердотельные накопители на базе Phison Контроллеры Phison
Дополнительные ресурсы:

Ниже приведены дополнительные ресурсы, альтернативные поставщикам услуг по восстановлению данных.
Secure Data Recovery Services, основанная в 2007 году, является одной из ведущих компаний, предлагающих профессиональные услуги по восстановлению данных. Они предоставляют услуги по восстановлению данных, ремонту RAID, ремонту жестких дисков, компьютерной криминалистике и многим другим мультимедийным услугам в своей безопасной и чистой комнате. У них есть опытные инженеры, оборудование для восстановления данных и сертифицированный класс 10 ISO 4.

Если ваше устройство издает ненормальные звуки (хороший источник плохих звуков можно найти здесь).

Читайте также: