Результаты испытаний на надежность SSD
Обновлено: 22.11.2024
Твердотельные накопители (SSD) могут работать в течение ограниченного периода времени. Как долго может длиться ваш?
Ожидаемый срок службы твердотельного накопителя зависит от нескольких факторов, таких как тип флэш-памяти NAND, количество операций записи и удаления данных с диска (также называемых циклом программирования/стирания), рабочей нагрузки и температуры. По мере того как твердотельный накопитель со временем изнашивается, число битовых ошибок увеличивается, а его способность хранить надежные данные снижается.
Компания ATP Electronics проводит тестирование по окончании срока службы (EOL), чтобы определить эффективность использования твердотельного накопителя в течение определенного периода с учетом факторов, упомянутых ранее. Цель состоит в том, чтобы убедиться, что наши твердотельные накопители продолжают надежно работать и поддерживать целостность данных в течение всего срока службы (и даже дольше) по мере необходимости.
Процесс проверки ATP EOL
Компания ATP использует систему Gym & Coach System для проведения серии комплексных проверочных тестов EOL на уровне привода. Это влечет за собой многочисленные циклы работы твердотельного накопителя с целью определения или подтверждения долговечности и надежности накопителя.
Этот тест помогает предсказать, как долго можно продолжать использовать SSD и когда SSD выйдет из строя, на основе целевого цикла P/E и срока хранения данных. Таким образом, клиенты могут определить, когда прекратить использование накопителя, и, следовательно, разработать план перехода для возможной замены.
В ходе проверочного теста ATP EOL проверяются следующие элементы:
- Проверка цикла программирования/стирания (P/E). Одной из основных причин износа флэш-памяти является количество выполненных циклов P/E. Во время этого теста на твердотельном накопителе выполняются циклы P/E до окончания его номинального срока службы, чтобы проверить возможности деградации и сохранения. Этот тест проверяет, может ли наше качество соответствовать рейтингу TBW, указанному в техническом описании. Образцы тестируемых устройств проверяются на 10 %, 75 %, 100 % и даже 120 % EOL, что превышает номинальный срок службы SSD.
- Поздняя проверка неверных блоков. Блоки флэш-памяти NAND могут изнашиваться в процессе использования, что делает их ненадежными или непригодными для использования. Этот тест проверяет наличие плохих блоков на разных этапах жизненного цикла твердотельного накопителя: 10 %/ 100 %/ 120 % EOL.
- Распределение количества P/E (выравнивание износа) Процесс испытаний ATP на выравнивание износа соответствует стандарту JEDEC JESD219 для класса приложений Enterprise. В процессе устаревания P/E за каждой записью должно следовать чтение (т. е. W/R = 1), и все ошибки регистрируются. Чтение исключительно в конце срока службы SSD недопустимо.
Рабочая нагрузка Enterprise Endurance Workload в соответствии с JESD219 состоит из случайных данных, распределенных по SSD. На следующем рисунке показано распределение полезной нагрузки по размеру.
Рис. 1. Распределение размера полезной нагрузки JESD 219 Enterprise Endurance Workload
Срок службы твердотельного накопителя – это показатель полезного жизненного цикла твердотельного накопителя. Срок службы твердотельного накопителя зависит от количества циклов записи/стирания, которое блок флэш-памяти может разумно выдержать, прежде чем возникнут серьезные ошибки или произойдет полный отказ.
Поскольку большинство твердотельных накопителей состоят из флэш-памяти NAND, расчеты зависят от среднего количества циклов записи NAND. Рассматривая флэш-память, мы обсудим, как проводить эти измерения и как продлить срок службы твердотельных накопителей.
Если вы ищете лучшие твердотельные накопители, посмотрите наш список лучших и самых быстрых твердотельных накопителей.
Ожидаемый срок службы SSD
По всему рынку твердотельных накопителей поставщики твердотельных накопителей оценивают надежность дисков по трем факторам:
- Возраст драйва
- Общее количество терабайт, записанных за время (TBW)
- Количество записей на Диск в день (DWPD)
Из трех только возраст диска является точным измерением. Поставщики и пользователи могут рассчитать TBW и DWPD, но некоторые цифры являются приблизительными.
Однако некоторые тесты из реальной жизни позволяют нам сделать разумные выводы. В 2016 году Google и Университет Торонто сообщили о результатах совместного четырехлетнего исследования, в ходе которого отслеживалась надежность твердотельных и жестких дисков в центрах обработки данных Google, интенсивно использующих данные.
Исследование показало, что возраст твердотельных накопителей был основным фактором отказов накопителей. Они также сообщили, что Google заменял SSD-накопители примерно на четверть реже, чем HDD. Однако твердотельные накопители сообщили о большем количестве ошибок, чем жесткие диски, с большим количеством плохих блоков и неисправимых ошибок.
Измерение долговечности SSD/флэш-памяти
Твердотельные накопители с флэш-памятью NAND имеют ограниченное количество циклов записи, прежде чем ячейка выйдет из строя, что выражается в рейтинге износостойкости. Причина физическая: каждый раз, когда накопитель записывает/стирает, оксидный слой ячейки флэш-памяти разрушается. Тип ячейки влияет на количество циклов записи до отказа. Обратите внимание, что при сравнении SLC, MLC и TLC вы увидите ключевые различия:
- SLC: одноуровневая флэш-память NAND поддерживает от 50 000 до 100 000 циклов записи.
- MLC: Флэш-память многоуровневой ячейки с 2-битными данными (MLC) обычно занимает до 3000 циклов записи. eMLC (корпоративный MLC) выдерживает до 10 000 циклов записи, а для 3D NAND может достигать 35 000 циклов.
- TLC: флэш-память NAND с трехуровневыми ячейками (3 разряда) имеет низкое значение — 300–1000 циклов записи, а с 3D NAND может достигать 1500–3000 циклов записи.
Когда вы думаете о циклах записи, также помните об усилении записи. Записи — это не просто одиночные записи на пользовательском или прикладном уровнях. Это многократная запись для избыточности и устойчивости к сбоям, когда контроллер копирует данные для обеспечения избыточности. Дополнительные источники усиления записи включают дедупликацию, запись файловой системы, структуры метаданных и журналов, а также сборку мусора.
Выносливость и долговечность SSD: TBW и DWPD
Записано терабайт (TBW)
TBW показывает, сколько совокупных операций записи накопитель может выполнить за весь срок службы. Например, если диск рассчитан на 300 ТБВт, это количество операций записи, которое может выполнить диск, прежде чем потребуется его замена.
Давайте посмотрим на линейку Samsung 850 Pro, созданную с использованием 3D V-NAND. Емкость включает 128 ГБ, 256 ГБ, 512 ГБ; и 1, 2 и 4 ТБ. Samsung рассчитывает TBW по емкости диска. Он предлагает 10-летнюю гарантию, если количество операций записи меньше максимального TBW.
- 256 ГБ: 150 ТБВт
- 512 ГБ и 1 ТБ: 300 ТБВт
- 2 ТБ: 450 ТБВт
- 4 ТБ: 600 ТБВт
Количество записей на диск в день (DWPD)
DWPD измеряет, сколько раз пользователь может перезаписывать весь твердотельный накопитель каждый день в течение гарантийного срока службы. Например, если DWPD равен 1 на SSD-накопителе емкостью 200 ГБ, а гарантийный срок составляет пять лет, то пользователи могут перезаписывать все 200 ГБ ежедневно в течение 5 лет, прежде чем ожидать сбоя. Пользователи также могут рассчитать TBW исходя из этого числа: при 200 ГБ в день в течение 365 дней в году в течение 5 лет TBW составляет 365.
Если его DWPD равен 2 на диске емкостью 200 ГБ с 5-летней гарантией, удвойте число, и вы получите 730 ТБ совокупного объема операций записи за 5 лет.
Выполнение расчета
По приведенной ниже формуле рассчитывается срок службы твердотельного накопителя. Уравнение: циклы записи x емкость, коэффициент SSD x данные, записываемые в год. Например, мы измерим Samsung 850 PRO, твердотельный накопитель TLC емкостью 1 ТБ.
Циклы записи = 3000
Емкость = 1 ТБ (1000 ГБ)
Коэффициент SSD: реальный объем данных к фактически записанным данным = оценка 5. Объем данных, записываемых на диск в год = оценка 1500–2000 ГБ.
Используя эти числа, ваше уравнение будет следующим: 3000 (циклы записи) x 1000 (емкость ГБ) / 5 (коэффициент SSD) x 1750 (ГБ записи на диск в год) = 342 года.
Никто не говорит, что твердотельные накопители будут безошибочны в течение 342 лет или что эта технология больше не будет существовать. Но мы можем быть достаточно уверены, что при этих цифрах его оксидный слой прослужит так долго.
Среднее время наработки на отказ (MTBF)
MTBF, или среднее время наработки на отказ, является популярным показателем для жестких дисков, но не столь значимым для жестких дисков. Даже с жесткими дисками среднее время безотказной работы не является точным измерением. Это статистические оценки, основанные на небольших размерах выборки. А поскольку ни один поставщик не хочет ждать пять лет непрерывного тестирования, прежде чем получить результаты, результаты экстраполируются за небольшой период.
Это приводит к тому, что среднее время безотказной работы на потребительских жестких дисках составляет полмиллиона часов между сбоями, что составляет около 57 лет. Корпоративные диски с более высокими объемами операций чтения и записи будут иметь меньшее время безотказной работы, но по-прежнему измеряются многими тысячами часов.
Для твердотельных накопителей измерение еще менее значимо, поскольку в них отсутствуют движущиеся части, которые вызывают механические поломки и жесткие диски. Надежность SSD с использованием MTBF примерно соответствует 2,5 миллионам часов MTBF для SSD. Это может быть интересной информацией, но она менее полезна, чем расчеты TBW и DWPD.
Техническое обслуживание SSD
Твердотельные накопители имеют длительный срок службы, но, как показало исследование Google, на них может быть больше ошибок, чем на жестких дисках, за более короткий период времени. Новые технологии не только увеличивают срок службы накопителей, но и повышают их надежность.
- Выравнивание износа равномерно распределяет записи по всем блокам SSD, поэтому они изнашиваются равномерно. Технологии выравнивания износа могут быть динамическими или статическими. Динамическое выравнивание износа отображает адреса логических блоков (LBA) из операционной системы во флэш-память. Он отслеживает, какой блок был стерт/записан последним, и записывает в другой блок. Статическое выравнивание износа также сопоставляет LBA с физическими блоками, но чередует неизмененные блоки для замены записанных блоков. Это также называется глобальным выравниванием износа.
- Программное обеспечение ECC (код исправления ошибок) исправляет случайные ошибки в битах, которые довольно часто встречаются во флэш-памяти NAND, и помогает исправить ошибки в битах из-за износа. Исправляя оба типа ошибок, ECC продлевает срок службы блока.
- Управление плохими блоками включает в себя методы Skip Block и Reserve Block, которые идентифицируют плохие блоки и предписывают контроллеру либо пропустить плохой блок и перейти к следующему хорошему, либо заменить плохой блок зарезервированным хорошим блоком.< /li>
- Команды TRIM не являются инструментами проверки ошибок, но повышают производительность за счет немедленного стирания удаленных страниц или блоков. Без TRIM контроллер SSD фактически не стирает удаленные данные, пока не будет готов записать новые данные в то же место. Поскольку TRIM стирается при удалении, производительность записи повышается.
Как проверить работоспособность SSD
Существует несколько предложений, которые помогут вам следить за состоянием ваших твердотельных накопителей. Лучше всего использовать решения, предназначенные для твердотельных накопителей, так как диагностика жестких дисков и решения могут повредить ваш диск. Тесты проверки работоспособности SSD включают S.M.A.R.T. и инструменты Samsung SSD, такие как Samsung Magician Software, но на рынке их много.
Информация о SSD от поставщиков
Пользователи не вправе самостоятельно проводить сложные измерения срока службы твердотельных накопителей вручную. Поставщики рассчитают для вас срок службы твердотельных накопителей, и в Интернете доступно множество калькуляторов, если вы хотите перепроверить. И обязательно продлите срок службы своих SSD-накопителей, сочетая измерения с выравниванием износа, ECC и управлением неисправными блоками.
Посмотрите наш список твердотельных накопителей для различных рабочих нагрузок: лучшие и самые быстрые твердотельные накопители
Мифы связаны со сроком службы твердотельных накопителей. SSD перестают работать быстрее, чем HDD?
На самом деле время запуска SSD-накопителей было непростым: первые SSD-хранилища страдали от проблем с прошивкой и снижением мощности. Однако с тех пор развитие технологии SSD не остановилось. Прошло несколько лет, и новые чипы и процедуры значительно улучшили технологию.
Как долго работает SSD?
Тот, кто задает этот вопрос на соответствующих интернет-форумах, чаще всего получает множество самых разных мнений. Если вы имеете дело с ожидаемым сроком службы SSD, вам сначала нужно взглянуть на типы переменных хранилищ SSD-накопителей. Доступны три хранилища SSD: одноуровневая ячейка (SLC), многоуровневая ячейка (MLC) и трехуровневая ячейка (TLC). Эти названия уже указывают на разницу. Тип хранения MLC сохраняет два бита на ячейку хранения, тип TLC — три бита на ячейку, а тип SLC — только один бит. Флэш-накопители SLC еще не получили широкого распространения из-за их ужасающих цен.
Для типов хранилищ и их срока службы применяется следующее: чем больше данных сохраняется в ячейке, тем выше уровень износа. Это означает, что сначала срок жизни типов хранения, возможно, может быть связан с циклами записи. Ячейки памяти типа MLC выдерживают около 3000 циклов записи. В первый момент это обязательно звучит не очень. Однако по сравнению с обычными жесткими дисками механика SSD не ухудшается только при чтении данных. Это означает, что SSD не будет изнашиваться только при чтении данных, что приводит нас к выводу, что это зависит от процессов записи и удаления.
Благодаря технологии Wear Leveling твердотельные накопители сделали большой шаг к повышению надежности. SSD новых поколений распределяют данные по всему хранилищу. При этом все ячейки хранения обрабатываются максимально бережно. Между тем, некоторые твердотельные накопители имеют так называемый режим SLC. Мы уже знакомы с этим термином из типов хранения, как объяснялось выше. На ячейку хранения на SLC SSD записывается только один бит. Когда накопитель MLC или TLC работает в режиме SLC, он фактически эмулирует хранилище SLC и вначале записывает только один бит на ячейку. Когда места для хранения становится недостаточно, накопитель переходит в режим работы в обычном режиме процедуры хранения.
Давайте проверим современные твердотельные накопители на выносливость, что означает постоянную запись на эти флэш-накопители с максимальной скоростью с использованием специальных инструментов. К настоящему времени твердотельные накопители показывают выдающиеся результаты в таких тестах. Только по прошествии лет происходит выпадение ячеек хранения. Однако даже для этих неработоспособных ячеек флэш-накопители имеют удачное решение. Текущие твердотельные накопители имеют резервную емкость. Эти места для хранения недоступны пользователю, но используются, так сказать, для восстановления поврежденных ячеек. Дефектные ячейки заменяются совершенно новыми резервными ячейками; эта процедура называется «Bad-Block-Management». Таким образом, ячейки хранения SSD при нормальной работе служат в течение всего срока службы.
Могу ли я рассчитать срок службы SSD-накопителя?
Чем больше ячеек памяти имеет твердотельный накопитель, тем дольше он будет работать. Обладая огромной емкостью, с ячейками памяти можно обращаться гораздо дольше, потому что они не так часто перезаписываются. Срок службы современного SSD можно рассчитать по формуле:
В качестве примера возьмем Samsung 850 PRO. 850 PRO — это твердотельный накопитель MLC с 3000 циклами записи. Емкость накопителя различается в зависимости от модели и составляет от 512 ГБ до 2 ТБ. Фактор SSD указывает соотношение реального объема данных к фактически записанным данным. Для расчета выбирается высокое значение 5. Кроме того, оценивается объем данных, записываемых на диск в год. Если оценка затруднена, мы рекомендуем выбрать значение от 1500 до 2000 ГБ.
Срок службы Samsung 850 PRO с 1 ТБ составляет:
Этот твердотельный накопитель, вероятно, прослужит невероятные 343 года. Это не гарантия, а хороший прогноз. Гарантия на названный SSD составляет десять лет. Кроме того, накопителям TLC не нужно прятаться. Срок службы модели Samsung 850 EVO объемом 1 ТБ, оснащенной недорогим типом хранилища TLC, составляет 114 лет.
Если ваш твердотельный накопитель уже некоторое время используется, вы можете рассчитать предполагаемый оставшийся срок службы с помощью специальных инструментов. Инструмент SSDlife подсчитывает рабочее время, количество уже записанных данных и дает оценку продолжительности жизни.
Могу ли я сделать что-то, чтобы оптимизировать срок службы моего SSD?
Не все инструменты для работы с жесткими дисками могут автоматически обрабатывать твердотельные накопители. Есть несколько инструментов, специально предназначенных для твердотельных накопителей, которые определенно позаботятся о вашем хранилище. Однако службы операционной системы, известные вам по обычным жестким дискам, такие как, например, дефрагментация, не подходят для твердотельных накопителей. Дефрагментация даже оказывается вредной для SSD из-за ненужных процессов записи и удаления. В целом, сортировка данных с помощью дефрагментации для SSD бесполезна: SSD одновременно обращаются ко всем областям хранения. Мы рекомендуем вам следующее программное обеспечение для оптимизации вашего SSD:
Samsung Magician Software — инструмент исключительно для твердотельных накопителей Samsung
В интернет-магазине CompuRAM вы найдете новейшие твердотельные накопители Samsung. Для наилучшего обслуживания Samsung рекомендует собственное программное обеспечение «Samsung Magician Software». С помощью этого инструмента можно не только увеличить скорость вашего SSD, но и проанализировать и улучшить срок службы вашего Samsung SSD. Инструмент информирует вас о состоянии диска и предлагает различные функции тестирования, оптимизации и удаления. Благодаря этим возможностям оптимизации службы операционной системы можно настроить для максимальной производительности и надежности вашего SSD.
Особенно интересна функция Magician «Перерасход ресурсов». С помощью этой функции можно максимально увеличить срок службы вашего SSD. Во время этой процедуры определенная область хранения не предоставляется пользователю. Эта область предназначена только для контроллера SSD. Он использует хранилище для эффективного обмена и администрирования временных данных. При этом Over Provisioning также поддерживает введенные процедуры Wear Leveling и Bad-Block-Management. В первую очередь SSD с небольшой емкостью выигрывают от Over Provisioning, потому что при этом гарантируется место для функций оптимизации. Обладателям больших SSD-накопителей Samsung изначально хватает места для функций администрирования.
Еще пару лет назад многих ИТ-администраторов и менеджеров беспокоил риск потери ценных данных из-за внезапного сбоя. Вот почему производителям потребовалось много времени, чтобы убедить общественность в безопасности использования твердотельных накопителей, даже при работе с конфиденциальными данными.
Твердотельный накопитель на основе флэш-памяти NAND — это совершенно другой носитель данных, чем традиционный жесткий диск, который сохраняет свои данные на магнитной пластине. Он состоит из электронного контроллера и нескольких микросхем памяти. Гибридный диск, также называемый SSHD, состоит из обеих технологий хранения: обычного магнитного жесткого диска и микросхем хранения.
Каковы преимущества твердотельных накопителей?
Основное преимущество электронных чипов для хранения данных заключается в том, что они намного быстрее, чем жесткие диски со шпинделем внутри. Это связано с тем, что обычный жесткий диск состоит из множества механических частей и вращающихся дисков. Кроме того, изменение положения головки чтения/записи занимает гораздо больше времени, чем просто передача данных через электронные интерфейсы. Кроме того, твердотельные накопители имеют очень короткое время доступа, что делает их идеальными для использования в средах, где необходим доступ и передача данных в реальном времени.
Каковы недостатки твердотельных накопителей?
Недостаток твердотельных накопителей с чипами на основе флэш-памяти NAND заключается в том, что по умолчанию они имеют ограниченный срок службы. В то время как обычные жесткие диски теоретически могут служить вечно (на самом деле максимум около 10 лет), срок службы твердотельных накопителей имеет встроенное «время смерти». Проще говоря: электрический эффект приводит к тому, что данные могут быть записаны в ячейку хранения внутри чипов только примерно от 3000 до 100000 раз за время их жизни. После этого ячейки «забывают» новые данные. Из-за этого факта, а также для предотвращения использования одних ячеек постоянно, а других нет, производители используют алгоритмы выравнивания износа для равномерного распределения данных контроллером по всем ячейкам. Как и в случае с жесткими дисками, пользователь может проверить текущее состояние твердотельного накопителя с помощью функции S.M.A.R.T. инструмент анализа, показывающий оставшийся срок службы твердотельного накопителя.
Оценка количества записанных терабайт (TBW)
Обычно производители указывают количество записанных терабайтов (TBW), особенно когда речь идет о корпоративных твердотельных накопителях, но также и о потребительских версиях. Из-за того, что при использовании Wear-Leveling данные будут распределены равномерно по всем ячейкам, эта цифра должна показывать, сколько данных может быть действительно записано во все ячейки внутри чипов хранения и за весь срок службы.< /p>
Типичный показатель TBW для твердотельного накопителя емкостью 250 ГБ составляет от 60 до 150 терабайт при записи. Это означает: чтобы преодолеть гарантированный TBW, равный 70, пользователю придется записывать 190(!) ГБ ежедневно в течение одного года (другими словами, каждый день заполнять две трети SSD новыми данными). В потребительской среде это маловероятно.
Пример Samsung
Samsung заявляет, что их Samsung SSD 850 PRO SATA емкостью 128 ГБ, 256 ГБ, 512 ГБ или 1 ТБ «создан для обработки 150 терабайт записи (TBW), что соответствует 40 ГБ ежедневного чтения/записи. нагрузки в течение десяти лет». Samsung даже обещает, что продукт «выдерживает запись до 600 терабайт (TBW)». Обычный офисный пользователь записывает примерно от 10 до 35 ГБ в обычный день. Даже если поднять этот объем до 40 ГБ, это означает, что они могли писать (и только писать) более чем почти 5 лет, пока не достигнут предела в 70 TBW.
Срок службы SSD даже больше обещанного
По последним оценкам, возраст твердотельных накопителей ограничен 10 летами, хотя средний срок службы твердотельных накопителей короче. В рамках совместного исследования Google и Университета Торонто твердотельные накопители тестировались в течение нескольких лет. Было обнаружено, что возраст SSD был основным фактором, определяющим, когда SSD перестал работать. Исследование также показало, что твердотельные накопители заменяются примерно на 25 % реже, чем жесткие диски.
Помните: в случае потери данных с твердотельных накопителей лучше всего обратиться к профессиональному поставщику услуг по восстановлению данных. Когда дело доходит до физической неисправности, у пользователя нет возможности восстановить или спасти свои данные самостоятельно. Кроме того, когда контроллер или микросхема памяти неисправны, попытка восстановить данные с помощью специализированного программного инструмента для восстановления данных еще более опасна. Это может привести к безвозвратной потере данных без возможности их восстановления.
Если они продлятся так долго, в чем опасность?
Несмотря на то, что средний срок службы твердотельного накопителя больше, чем первоначально предполагалось, использование этого носителя данных по-прежнему представляет серьезную угрозу: восстановление данных с неисправных твердотельных накопителей по-прежнему является более сложной задачей для поставщиков услуг по восстановлению данных, чем с жестких дисков, поскольку доступ к устройству часто затруднен. . Когда микросхема контроллера SSD сломана, доступ к устройству и микросхемам хранения невозможен. Решение этой проблемы заключается в попытке найти исправную микросхему контроллера, идентичную неисправной, удалить и заменить ее на идентичную для получения доступа. То, что звучит довольно просто, на самом деле является сложной задачей. Это относится и к попыткам доступа к данным из неисправных микросхем памяти. Во многих случаях специалисты по восстановлению данных, такие как специалисты Ontrack, могут сбросить данные. За последние несколько лет Ontrack разработала множество специальных инструментов и процессов для решения этих проблем и успешно восстановила потерянные данные.
Помните: в случае потери данных с твердотельных накопителей лучше всего обратиться к профессиональному поставщику услуг по восстановлению данных. Когда дело доходит до физической неисправности, у пользователя нет возможности восстановить или спасти свои данные самостоятельно. Кроме того, когда контроллер или микросхема памяти неисправны, попытка восстановить данные с помощью специализированного программного инструмента для восстановления данных еще более опасна. Это может привести к безвозвратной потере данных без возможности их восстановления.
Чтобы поговорить с представителем службы восстановления данных, позвоните нам или отправьте запрос:
Твердотельные накопители (SSD) все больше и больше становятся частью среды хранения данных.И хотя наша серия SSD 101 охватывает такие темы, как модернизация, устранение неполадок и утилизация ваших твердотельных накопителей, мы хотели бы проверить одно из наиболее популярных заявлений сторонников твердотельных накопителей: твердотельные накопители выходят из строя намного реже, чем наш старый друг, жесткий диск. (жесткий диск). Это утверждение обычно приписывается тому, что твердотельные накопители не имеют движущихся частей, и подтверждается декларациями поставщиков и неясными расчетами среднего времени наработки на отказ (MTBF). Все это хорошо для маркетинговых целей SSD, но для сравнения частоты отказов мы предпочитаем метод Drive Stats: прямое сравнение. Приступим.
Как выглядит отказ накопителя для твердотельных и жестких дисков?
В наших ежеквартальных отчетах "Статистика диска" мы определяем сбой жесткого диска как реактивный, то есть диск больше не работает, или как упреждающий, то есть мы считаем, что отказ диска неизбежен. Для жестких дисков большая часть данных, которые мы используем для определения упреждающего сбоя, поступает из статистики SMART, которую мы отслеживаем и которая сообщается с диска.
SMART, или S.M.A.R.T., означает технологию самоконтроля, анализа и отчетности и представляет собой систему мониторинга, встроенную в жесткие диски и твердотельные накопители. Основная функция SMART состоит в том, чтобы сообщать о различных индикаторах, связанных с надежностью диска, с целью прогнозирования сбоев диска. Backblaze ежедневно записывает атрибуты SMART для каждого диска с данными и загрузочного диска.
Как и в случае с жесткими дисками, мы также записываем и отслеживаем статистику SMART для твердотельных накопителей. Различные модели твердотельных накопителей сообщают разные статистические данные SMART с некоторым совпадением. На сегодняшний день мы записываем 31 атрибут статистики SMART, связанный с твердотельными накопителями. 25 перечислены ниже.
Для оставшихся шести (16, 17, 168, 170, 218 и 245) мы не можем найти их определения. Пожалуйста, напишите в комментариях, если вы можете пролить свет на отсутствующие атрибуты.
При всем при этом мы только начинаем использовать SMART-статистику для упреждающего выявления сбоев SSD. Многие из приведенных атрибутов зависят от модели диска или поставщика. Кроме того, как вы увидите, количество сбоев SSD ограничено. Это ограничивает количество данных, которые мы имеем для исследований. По мере того, как мы добавляем и отслеживаем все больше твердотельных накопителей в нашей ферме, мы намерены разработать правила для упреждающих отказов твердотельных накопителей. Между тем, все SSD, которые вышли из строя на сегодняшний день, являются реактивными сбоями, то есть: они просто перестали работать.
Сравнение яблок с яблоками
В центрах обработки данных Backblaze мы используем как твердотельные, так и жесткие диски в качестве загрузочных дисков на наших серверах хранения. В нашем случае описание этих дисков как загрузочных является неправильным, поскольку загрузочные диски также используются для хранения файлов журналов для доступа к системе, диагностики и многого другого. Другими словами, эти загрузочные диски регулярно читают, записывают и удаляют файлы в дополнение к своей названной функции загрузки сервера при запуске.
В наших первых серверах хранения мы использовали жесткие диски в качестве загрузочных, поскольку они были недорогими и подходили для этой цели. Так продолжалось до середины 2018 года, когда мы смогли купить твердотельные накопители емкостью 200 ГБ примерно за 50 долларов США, что было нашей максимальной ценой на загрузочные диски для каждого сервера хранения. Это был эксперимент, но все получилось настолько хорошо, что с середины 2018 года мы перешли на использование только SSD в новых серверах хранения и заменили вышедшие из строя загрузочные HDD на SSD.
У нас есть две группы дисков, SSD и HDD, которые выполняют одни и те же функции, имеют одинаковую рабочую нагрузку и работают в одной и той же среде с течением времени. Поэтому, естественно, мы решили сравнить частоту отказов загрузочных дисков SSD и HDD. Ниже приведены показатели отказов в течение всего срока службы для каждой когорты по состоянию на второй квартал 2021 года.
Твердотельные накопители побеждают… Подождите, не так быстро!
Все кончено, твердотельные накопители побеждают. Пришло время превратить ваши жесткие диски в подставки для книг и дверных упоров и купить твердотельные накопители. Тем не менее, прежде чем вы начнете играть в домино со своими жесткими дисками, необходимо принять во внимание несколько вещей, которые выходят за рамки номинальной стоимости в приведенной выше таблице: средний возраст и количество дней вождения.
- Средний возраст твердотельных накопителей – 14,2 месяца, а средний возраст жестких дисков – 52,4 месяца.
- Самым старым дискам SSD около 33 месяцев, а самым молодым жестким дискам — 27 месяцев.
Как правило, графики среднего возраста твердотельных и жестких дисков не слишком сильно совпадают. Жесткие диски в среднем более чем на три года старше, чем твердотельные накопители. Это помещает каждую когорту в очень разные моменты их жизненного цикла. Если вы согласны с тем, что с возрастом диски выходят из строя чаще, вы можете немного отложить вечеринку по уничтожению жестких дисков.
Кстати, через пару недель мы опубликуем сообщение о том, насколько частота отказов дисков соответствует кривой ванны; СПОЙЛЕР: старые диски часто выходят из строя.
Другим фактором, который мы указали, были дни работы, количество дней, в течение которых все диски в каждой когорте работали без сбоев.Большая разница в количестве дней в пути приводит к большой разнице в доверительных интервалах двух когорт, поскольку количество наблюдений (т. е. дней в пути) значительно различается.
Чтобы сделать сравнение более точным, мы можем попытаться учесть в нашем анализе средний возраст и количество дней вождения. Для этого мы можем перенести когорту жестких дисков в прошлое в наших записях, чтобы увидеть, где средний возраст и количество дней вождения схожи со средним возрастом и количеством дней вождения, аналогичными для SDD из второго квартала 2021 года. Это позволило бы нам одновременно сравнивать каждую когорту в их жизненные циклы.
Поворачивая время вспять для жестких дисков, мы обнаруживаем, что, используя данные жестких дисков за четвертый квартал 2016 года, мы смогли создать следующее сравнение.
Неожиданно оказалось, что разница в годовой частоте отказов (AFR) между твердотельными и жесткими дисками не так велика. Фактически, каждый тип диска находится в пределах окна доверительного интервала другого 95%. Это окно довольно широкое (плюс-минус 0,5%) из-за относительно небольшого количества дней вождения.
Где это нас оставляет? У нас есть некоторые доказательства того, что когда оба типа дисков молодые (в данном случае в среднем 14 месяцев), твердотельные накопители выходят из строя реже, но ненамного. Но вы не покупаете диск на 14 месяцев, вы хотите, чтобы он служил годами. Что мы знаем об этом?
Частота отказов с течением времени
У нас есть данные по загрузочным HDD-накопителям за 2013 год и по SSD-накопителям за 2018 год. На приведенной ниже диаграмме показан показатель AFR за весь срок службы для каждого типа накопителей до второго квартала 2021 года.
Как видно из графика, начиная с 2018 года частота отказов загрузочных жестких дисков увеличилась. Это продолжалось в 2019 и 2020 годах, прежде чем выровнялось в 2021 году (пока). Чтобы констатировать очевидное, с возрастом парка загрузочных жестких дисков увеличивалась и частота отказов.
Особый интерес представляет сходство двух кривых в первых четырех точках данных. Для когорты жестких дисков пятый год (2018 г.) стал началом ускорения частоты отказов. Та же участь ждет и наши твердотельные накопители по мере их старения? Хотя мы можем ожидать некоторого увеличения AFR по мере старения твердотельных накопителей, будет ли оно таким же значительным, как линейка жестких дисков?
Время принятия решения: SSD или HDD
Что нам остается делать при выборе между покупкой твердотельного накопителя или жесткого диска? Учитывая то, что мы знаем на сегодняшний день, использование частоты отказов в качестве фактора при принятии решения сомнительно. После того, как мы контролировали возраст и количество дней работы с дисками, два типа дисков были похожи, и разница, безусловно, была недостаточной сама по себе, чтобы оправдать дополнительные затраты на покупку твердотельного накопителя по сравнению с жестким диском. На этом этапе вам лучше принять решение, основываясь на других факторах: стоимости, требуемой скорости, электроэнергии, требованиях к форм-фактору и т. д.
В течение следующих нескольких лет, когда мы получим более полное представление о частоте отказов твердотельных накопителей, мы сможем решить, следует ли добавлять AFR в контрольный список руководства по выбору твердотельных накопителей и жестких дисков. А пока мы с нетерпением ждем продолжения обсуждения.
Об Энди Кляйне
Энди Кляйн — главный пропагандист облачных хранилищ в Backblaze. Он имеет более чем 25-летний опыт работы в технологическом маркетинге, и за это время он поделился своим опытом в области облачных хранилищ и компьютерной безопасности на мероприятиях, симпозиумах и панелях в RSA, SNIA SDC, MIT, Федеральной торговой комиссии и сотнях других. В настоящее время он пишет и разглагольствует о статистике дисков, модулях хранения, облачном хранилище и многом другом.
Читайте также: