Что такое IOPS ssd
Обновлено: 21.11.2024
Понимание производительности хранилища — IOPS и задержка
Введение
Цель этой записи в блоге – помочь вам лучше понять производительность хранилища. Я хочу обсудить некоторые основные принципы, которые верны независимо от ваших конкретных потребностей.
Это поможет вам лучше рассуждать о хранении и может послужить основой для дальнейшего обучения.
Если вы полностью запускаете свои приложения/рабочие нагрузки в облаке, эта информация может показаться устаревшей или неактуальной.
Однако, поскольку облако — это просто чьи-то вычислительные ресурсы и хранилище, знания о хранении могут быть актуальны. Поставщики облачных услуг предоставляют вам показатели производительности хранилища, и это может помочь вам разобраться в них.
Концепции
Ввод-вывод – это один запрос на чтение/запись. Этот ввод-вывод направляется на носитель данных (например, на жесткий диск или твердотельный накопитель).
Это может быть запрос на чтение определенного файла с диска. Или это может быть запрос на запись некоторых данных в существующий файл. Чтение или запись файла может привести к нескольким запросам ввода-вывода.
Размер запроса ввода-вывода
Запрос ввода-вывода имеет размер. Запрос может быть маленьким (например, 1 килобайт) или большим (несколько мегабайт). Различные рабочие нагрузки приложений будут выполнять операции ввода-вывода с разными размерами запросов. Размер запроса ввода-вывода может повлиять на показатели задержки и IOPS (два показателя, которые мы вскоре обсудим).
IOPS означает количество операций ввода-вывода в секунду. Это показатель производительности, который часто используется (и злоупотребляется) в мире хранения. Он сообщает нам, сколько запросов ввода-вывода в секунду может обрабатывать хранилище (для конкретной рабочей нагрузки).
Внимание! без значения задержки этот показатель не имеет смысла. Вскоре мы обсудим задержку.
Пропускная способность или пропускная способность
Если вы умножите показатель IOPS на (средний) размер запроса ввода-вывода, вы получите полосу пропускания или пропускную способность. Обычно пропускная способность хранилища указывается в мегабайтах и гигабайтах в секунду.
В качестве примера: если мы создадим рабочую нагрузку 1000 IOPS с размером запроса 4 КБ, мы получим пропускную способность 1000 x 4 КБ = 4000 КБ. Это примерно ~4 мегабайта в секунду.
Задержка
Задержка — это время, необходимое для выполнения запроса ввода-вывода. Мы начинаем измерение с момента отправки запроса на уровень хранения и прекращаем измерение, когда либо получаем запрошенные данные, либо получаем подтверждение того, что данные сохранены на диске.
Задержка — это самый важный показатель, на который следует обращать внимание, когда речь идет о производительности хранилища в большинстве случаев.
Для жестких дисков приемлемой считается средняя задержка от 10 до 20 мс (верхний предел – 20 мс).
Для твердотельных накопителей, в зависимости от рабочей нагрузки, оно никогда не должно превышать 1–3 мс. В большинстве случаев рабочие нагрузки будут иметь задержку менее 1 мс.
IOPS и задержка
Это очень важная концепция для понимания. Метрика IOPS не имеет смысла без заявления о задержке. Вы должны понимать, сколько времени займет каждая операция ввода-вывода, поскольку задержка определяет скорость отклика отдельных операций ввода-вывода.
Если решение для хранения может достигать 10 000 операций ввода-вывода в секунду, но только при средней задержке 50 мс, это может привести к очень низкой производительности приложения. Если мы хотим достичь максимальной задержки в 10 мс, решение для хранения может быть способно только на 2000 операций ввода-вывода в секунду.
Для получения более подробной информации по этой теме я бы порекомендовал этот блог и этот блог.
Шаблоны доступа
Последовательный доступ
Примером последовательной передачи данных является копирование большого файла с одного жесткого диска на другой. Большое количество последовательных (часто смежных) блоков данных считывается с исходного диска и записывается на другой диск. Задания резервного копирования также вызывают шаблоны последовательного доступа.
На практике этот шаблон доступа показывает максимально возможную пропускную способность.
С жесткими дисками все проще, поскольку им не нужно тратить много времени на перемещение головок чтения/записи, и они могут тратить большую часть времени на чтение/запись фактических данных.
Произвольный доступ
Запросы ввода-вывода отправляются на носитель данных случайным образом. Данные могут храниться в разных регионах на носителе. Примером такого шаблона доступа является сильно загруженный сервер базы данных или узел виртуализации, на котором запущено множество виртуальных машин (все они работают одновременно).
Жестким дискам придется тратить много времени на перемещение головок чтения/записи, а на передачу данных уйдет совсем немного времени. И пропускная способность, и число операций ввода-вывода в секунду резко упадут (по сравнению со схемой последовательного доступа).
На практике наиболее распространенные рабочие нагрузки, такие как запуск баз данных или виртуальных машин, вызывают шаблоны произвольного доступа в системе хранения.
Глубина очереди
Глубина очереди — это число от 1 до ~128, которое показывает, сколько в среднем запросов ввода-вывода находится в очереди (в процессе выполнения).Наличие очереди выгодно, так как запросы в очереди могут быть отправлены в подсистему хранения оптимизированным образом и часто параллельно. Очередь повышает производительность за счет задержки.
Если у вас есть какое-либо решение для мониторинга производительности хранилища, большая глубина очереди может указывать на то, что подсистема хранения не справляется с рабочей нагрузкой. Вы также можете наблюдать более высокие, чем обычно, значения задержки. Пока показатели задержки находятся в допустимых пределах, проблем может и не быть.
Характеристики производительности носителя
Жесткие диски
Жесткие диски (HDD) — это механические устройства, напоминающие проигрыватель.
У них есть рука с головкой чтения/записи, а данные хранятся на (нескольких) пластинах.
Жесткие диски должны физически перемещать головки чтения/записи для выполнения запросов на чтение/запись. Эта механическая природа делает их относительно медленными по сравнению с твердотельными накопителями (о которых мы вскоре расскажем).
Особенно рабочие нагрузки с произвольным доступом заставляют жесткие диски тратить много времени на перемещение головки чтения/записи в нужное положение в нужное время, поэтому на фактическую передачу данных остается меньше времени.
Самое важное, что нужно знать о жестких дисках, это то, что с точки зрения производительности (с акцентом на задержку) более высокая скорость шпинделя снижает среднюю задержку.
Скорость вращения (об/мин) | Задержка доступа (мс) | IOPS |
---|---|---|
5400 | 17-18 | 50-60 |
7200 | 12-13 | 75-85 |
10 000 | 7-8 | 120-130 |
15 000 | td>5-6 | 150-180 |
Поскольку задержка отдельных запросов ввода-вывода меньше для дисков с более высоким числом оборотов в минуту, вы можете отправить больше таких запросов за то же время. Вот почему показатель IOPS также увеличивается.
Задержка и IOPS более старого накопителя Western Digital Velociraptor 10 000 об/мин:
Обратите внимание на задержку и IOPS в столбце Queue Depth = 1.
Источник, использованный для проверки моего собственного исследования.
Что касается последовательной пропускной способности, мы можем констатировать, что довольно старые жесткие диски могут поддерживать пропускную способность 100-150 мегабайт в секунду. Более современные жесткие диски большей емкости часто могут поддерживать скорость от 200 до 270 МБ в секунду.
Важное примечание: скорость последовательной передачи непостоянна и зависит от физического расположения данных на пластинах жесткого диска. По мере заполнения диска пропускная способность уменьшается. Пропускная способность может упасть более чем на пятьдесят процентов! 1 .
Поэтому, если вы хотите рассчитать, сколько времени потребуется для передачи определенного (большого) набора данных, вам необходимо принять это во внимание.
Твердотельные накопители
Твердотельные накопители (SSD) не имеют движущихся частей, в их основе лежит флэш-память (чипы). Твердотельные накопители могут обрабатывать операции ввода-вывода намного быстрее и, следовательно, демонстрируют значительно меньшую задержку.
В то время как мы измеряем среднюю задержку ввода-вывода для жестких дисков в миллисекундах (тысячная доля секунды), мы измеряем задержку операций ввода-вывода SSD в микросекундах (миллионная доля секунды).
Благодаря уменьшенной задержке на запрос ввода-вывода твердотельные накопители превосходят жесткие диски по всем возможным параметрам. Даже дешевый потребительский твердотельный накопитель может выдержать не менее 5000+ операций ввода-вывода в секунду с задержкой всего 0,15 миллисекунды (150 микросекунд). Эта задержка примерно в 40 раз лучше, чем лучшая задержка корпоративного жесткого диска со скоростью вращения 15 000 об/мин.
Твердотельные накопители часто могут обрабатывать запросы ввода-вывода параллельно. Это означает, что большая глубина очереди с большим количеством запросов ввода-вывода может показать значительно более высокие показатели IOPS с ограниченным (но не незначительным) увеличением задержки.
Более современные корпоративные твердотельные накопители демонстрируют меньшее время задержки и меньшее количество операций ввода-вывода в секунду. Интерфейс SATA кажется основным узким местом.
Производительность произвольного ввода-вывода корпоративного твердотельного накопителя SATA
Твердотельные накопители работают лучше, чем жесткие диски, по всем релевантным показателям, кроме соотношения цены и емкости.
Важное примечание. SSD плохо подходят для архивного хранения данных. Данные хранятся в виде зарядов в чипах, и эти заряды могут уменьшаться со временем. Ожидается, что даже жесткие диски лучше подходят для автономного архивирования, хотя наиболее подходящим методом хранения, вероятно, будет магнитная лента.
Фактическая производительность SSD и заявленная производительность
Многие твердотельные накопители рекламируются с показателями производительности от 80 000 до 100 000 операций ввода-вывода в секунду при приличной задержке. В зависимости от рабочей нагрузки вы можете наблюдать только часть этой производительности.
Большинство из этих высоких значений 80–100 000 операций ввода-вывода в секунду получены в результате сравнительного анализа с очень большой глубиной очереди (16–32). SSD выигрывает от такой глубины очереди, потому что он может обрабатывать множество этих запросов ввода-вывода параллельно.
Если мы посмотрим на приведенную выше диаграмму твердотельных накопителей Intel, то заметим, что показатели IOPS начинают приближаться к заявленным 80 000+ IOPS только по мере увеличения глубины очереди. Поэтому важно понимать особенности своей рабочей нагрузки.
Если мы сгруппируем несколько жестких дисков вместе, мы можем создать массив RAID. RAID-массив — это виртуальное запоминающее устройство, которое превосходит по емкости и производительности один жесткий диск. Это позволяет масштабировать хранилище в пределах одного компьютера.
RAID также используется (или, как говорят некоторые, в первую очередь) для обеспечения доступности за счет обеспечения избыточности (сбой диска не приведет к потере данных). Но в этой статье мы сосредоточимся на его характеристиках производительности.
Твердотельные накопители могут достигать впечатляющих скоростей последовательной пропускной способности в несколько гигабайт в секунду. Отдельные жесткие диски никогда не смогут приблизиться к этим скоростям, но если вы поместите их вместе в массив RAID, вы сможете приблизиться к ним очень близко. Например, мой собственный NAS достигает таких скоростей, используя 24 диска.
RAID также повышает производительность шаблонов произвольного доступа. Жесткие диски в массиве RAID работают в тандеме для обслуживания этих запросов ввода-вывода, поэтому массив RAID показывает значительно более высокие показатели IOPS, чем один диск. Больше дисков — больше операций ввода-вывода в секунду.
RAID 5 с 8 дисками 7200 об/мин
Обратите внимание, как увеличивается количество операций ввода-вывода в секунду по мере увеличения глубины очереди.
Однако в этом мире нет ничего бесплатного. Большая глубина очереди, которая действует как буфер, увеличивает задержку.
Обратите внимание, как быстро задержка превышает 20 мс и быстро становится практически непригодной для использования.
RAID 5 с 8 дисками по 10 000 об/мин
Ниже приведены результаты аналогичного теста с жесткими дисками со скоростью вращения 10 000 об/мин. Обратите внимание, насколько лучше показатели IOPS и задержки.
Задержка выглядит намного лучше:
Твердотельные накопители имеет смысл объединять в RAID. Хотя они более надежны, чем жесткие диски, они могут выйти из строя. Если вам важна доступность, RAID неизбежен. Кроме того, вы можете наблюдать те же преимущества, что и с жесткими дисками: вы объединяете ресурсы вместе, достигая более высоких показателей IOPS и большей емкости, чем это возможно с одним твердотельным накопителем.
Емкость и производительность
Следующее в основном относится к жестким дискам, хотя может относиться и к твердотельным накопителям.
Мы объединяем жесткие диски в массивы RAID, чтобы увеличить количество операций ввода-вывода в секунду по сравнению с одним диском. В какой-то момент — по мере увеличения рабочей нагрузки — мы можем достичь максимального числа операций ввода-вывода в секунду, которое массив RAID может поддерживать с приемлемой задержкой.
Этот порог IOPS/латентности может быть достигнут, даже если мы используем только 50 % емкости хранилища нашего RAID-массива. Если мы используем массив RAID, например, для размещения виртуальных машин, мы не можем добавить больше виртуальных машин, потому что это приведет к увеличению задержки до неприемлемого уровня.
Может показаться, что много хорошего места для хранения будет потрачено впустую, и в некотором смысле это может быть правдой. По этой причине может быть разумной стратегией покупать диски меньшего размера на 10 000 или 15 000 об/мин исключительно из-за количества операций ввода-вывода в секунду, которые они могут обеспечить, а не из-за емкости.
Возможно, вам придется заказать и добавить, скажем, еще 10 жестких дисков, чтобы удовлетворить требования к IOPS/задержке, пока еще остается достаточно места.
Такая ситуация маловероятна, так как твердотельные накопители взяли на себя роль высокопроизводительного хранилища, а жесткие диски (большей емкости) выдвинуты в роли «онлайн» архивного хранилища.
Заключительные слова
Я надеюсь, что эта статья помогла вам лучше понять производительность хранилища. Хотя это всего лишь введение, оно может помочь вам лучше понять проблемы, связанные с производительностью хранилища.
При оценке новой системы хранения, особенно массива на основе флэш-памяти, количество операций ввода-вывода в секунду (вводов/выводов в секунду), которое может поддерживать система хранения, часто используется для того, чтобы отличить одну систему хранения от другой. Но действительно ли этот стандарт заслуживает внимания, учитывая требования современного центра обработки данных и возможности современных систем хранения данных?
Существуют три фактора, которые в совокупности дают полное представление о производительности хранилища. пропускная способность, задержка и IOPS. Большинство поставщиков систем хранения, как правило, сосредотачиваются на IOPS, чтобы похвастаться скоростью своих систем хранения.Но измерение производительности системы хранения по количеству операций ввода-вывода в секунду имеет смысл только в том случае, если рабочие нагрузки, использующие эту систему хранения, требуют большого количества операций ввода-вывода в секунду.
Скорость передачи и количество операций ввода-вывода в секунду
При попытке определить общую производительность системы хранения необходимо учитывать множество переменных. Существуют внешние факторы, такие как то, как данные считываются из системы хранения или записываются в нее, а также скорость самой структуры сети хранения. Существуют также внутренние факторы, такие как мощность процессора вычислительного механизма хранилища (контроллера хранилища), эффективность программного обеспечения хранилища и, конечно же, скорость носителя, установленного в системе хранения.
Для целей этой статьи мы предполагаем, что все внешние факторы равны. Если это так, то скорость передачи — это, по сути, скорость, с которой контроллер хранения может перемещать непрерывный блок данных через программное обеспечение хранения на носитель данных. Обычно она измеряется в МБ/с, и важна высокая скорость передачи, особенно для последовательных рабочих нагрузок.
Однако IOPS отличается; они измеряются как целое число. Это относится к максимальному количеству операций чтения и записи в несмежных местах хранения. В этих операциях обычно преобладает время поиска или время, которое требуется дисковому накопителю для позиционирования головок чтения/записи в правильном месте. Поскольку такое расположение головок занимает очень много времени, важность мощности ЦП контроллера хранения и эффективности программного обеспечения хранения в массиве жестких дисков значительно сведена к минимуму. Флэш-массивы практически исключают время поиска из рассмотрения и, как таковые, делают другие переменные, такие как мощность контроллера хранения и эффективность программного обеспечения хранения, гораздо более важными. Контроллер хранилища и программное обеспечение хранилища больше не могут прятаться за низкой производительностью жесткого диска. Flash показывает их такими, какие они есть.
В качестве примера давайте сравним, как две рабочие нагрузки, обращающиеся к одному и тому же объему данных, требуют значительно различающегося количества операций ввода-вывода в секунду. Первая рабочая нагрузка требует чтения десяти файлов размером 750 МБ, 7,5 ГБ, и для передачи требуется 100 секунд. Это означает, что скорость передачи составляет 75 МБ/с и потребляет 10 операций ввода-вывода в секунду, что вполне соответствует возможностям одного жесткого диска. Вторая рабочая нагрузка требует чтения десяти тысяч файлов по 750 КБ, такого же объема данных, 7,5 ГБ, но потребляет 10 000 операций ввода-вывода в секунду. Поскольку типичный дисковый накопитель не может генерировать более 200 операций ввода-вывода в секунду, этот запрос не будет выполнен за те же 100 секунд. Это пример того, как разные рабочие нагрузки могут требовать существенно разной производительности при использовании одной и той же емкости хранилища.
Имеет ли значение IOPS? – Простой ответ, нет
Не говоря уже об определении IOPS, возникает следующий вопрос: должен ли ИТ-специалист беспокоиться о потенциальной производительности IOPS системы хранения? IOPS были гораздо более важным показателем в эпоху массивов жестких дисков, потому что потенциальное количество IOPS часто было меньше, чем нужно центру обработки данных. В эпоху массивов all-flash верно обратное. Большинство массивов на флэш-дисках обеспечивают гораздо большую производительность операций ввода-вывода в секунду, чем требуется большинству центров обработки данных.
Измерениям IOPS нельзя доверять
Еще одна проблема, связанная с использованием IOPS для различения систем хранения на флэш-дисках, заключается в том, что существует слишком много способов генерировать число IOPS, как показано на приведенном выше рисунке. На количество операций ввода-вывода в секунду может существенно повлиять размер используемого блока, сочетание операций чтения/записи и степень случайности в этом потоке ввода-вывода. Даже если бы все поставщики стандартизировали порядок установки каждой из этих переменных, это не имело бы большого значения для центра обработки данных. Например, если все поставщики заявят, что сообщат о IOPS в тестах с использованием блоков размером 4 КБ и 50 % случайного сочетания операций чтения/записи, полученное число не будет иметь большого значения для центра обработки данных, рабочие нагрузки которого генерируют 32 КБ блоков с 80 % операций чтения и записи. соотношение. Наконец, в большинстве центров обработки данных на массиве all-flash будет выполняться несколько рабочих нагрузок. Скорее всего, он будет поддерживать широкий спектр рабочих нагрузок с различными сочетаниями операций чтения и записи.
Правильное измерение
Правильный способ измерить производительность массива all-flash или даже гибридного массива — разработать статистику производительности на основе конкретных рабочих нагрузок или сочетания рабочих нагрузок. Например, запустите тест производительности SQL и тест производительности VDI одновременно в одной и той же системе хранения и вместо отчета о потребленных операциях ввода-вывода в секунду создайте отчет о данных, которые являются более реальными и актуальными для центра обработки данных. В этом случае это может быть количество одновременных пользователей SQL и поддерживаемых экземпляров VDI при сохранении приемлемого времени отклика.
Модернизируемая производительность
Как уже говорилось выше, большинство массивов на флэш-дисках обеспечивают более высокую производительность, чем сегодня может обеспечить большинство центров обработки данных. Но сегодня ключевое слово здесь. Поскольку плотность виртуальных серверов и виртуальных рабочих столов, а также количество пользователей на экземпляр базы данных продолжают расти, центрам обработки данных потребуется все больше и больше производительности. Сам флэш-носитель станет немного быстрее, но основным препятствием на пути повышения производительности будет контроллер системы хранения и эффективность программного обеспечения для хранения данных.
Функции и возможности программного обеспечения для хранения данных увеличивают производительность флэш-памяти. Эффективность этого программного обеспечения для хранения в том, как оно выполняет эти различные возможности, имеет решающее значение для общей производительности. К счастью, у производителя флеш-накопителей есть доступ к постоянно растущим вычислительным мощностям, которые могут маскировать большую часть накладных расходов программного обеспечения для хранения данных. Однако крайне важно, чтобы поставщик флэш-памяти мог предоставить возможность обновления аппаратного обеспечения своего контроллера, чтобы их клиенты могли воспользоваться преимуществами повышенной мощности каждой итерации процессоров Intel.
Заключение
Использование IOPS для различения флэш-массивов – рискованная практика. Большинство систем обеспечивают больше операций ввода-вывода в секунду, чем требуется типичному центру обработки данных. Эти центры обработки данных могут с большей пользой потратить свое время на поиск массива флэш-памяти, который предоставляет необходимые им функции по доступной цене, а также способ обновления, чтобы продолжать опережать спрос на производительность.
Для тех центров обработки данных, которым требуется достаточно высокая производительность, чтобы значение IOPS могло иметь значение, показатели IOPS, предоставляемые поставщиком, слишком сильно различаются между собой, чтобы обеспечить значимое различие между ними. Этим центрам обработки данных лучше запрашивать конкретные результаты на основе набора рабочих нагрузок, которые точно соответствуют их среде.
Имея 8-летний опыт работы в сфере ИТ-маркетинга, Джо является старшим менеджером по маркетингу в Lunavi и отвечает за цифровой маркетинг и коммуникации.
Ваш надежный консультант по корпоративным ИТ-услугам: гибридные ИТ, облачные технологии, цифровая трансформация, центр обработки данных и консалтинг.
Производительность приложений часто зависит от того, насколько хорошо ваше хранилище может передавать данные конечным клиентам. По этой причине вы должны правильно спроектировать или выбрать скорость уровня хранилища с точки зрения как IOPS, так и пропускной способности, которые оценивают скорость и пропускную способность хранилища соответственно.
Введение в IOPS
IOPS означает число операций ввода/вывода в секунду. Это измерение производительности жестких дисков (HDD или SSD) и сетей хранения данных. IOPS показывает, насколько быстро данное устройство хранения или носитель может считывать и записывать команды каждую секунду.
Внутреннее количество операций ввода-вывода в секунду связано с физическими ограничениями самого носителя и равно 1000 миллисекунд / (среднее время поиска + средняя задержка), причем последние два значения также измеряются в миллисекундах.
Внутренние операции ввода-вывода в секунду зависят от скорости вращения жесткого диска, если это применимо (твердотельные накопители не вращаются, в отличие от традиционных жестких дисков). Средняя задержка в приведенной выше формуле — это время, за которое пластина диска совершает половину оборота. Он рассчитывается путем деления 60 секунд на скорость вращения диска, затем деления результата на 2 и умножения всего на 1000 миллисекунд. ((60 / об/мин)/2)*1000.
Конечно, для твердотельных накопителей средняя задержка значительно снижается, так как внутри нет вращающегося диска. Поэтому вы можете просто указать 0,1 мс в качестве средней задержки для учета сетевого трафика между процессором вашего сервера/виртуальной машины и массивом хранения или устройством. Подробнее о проблемах с сетью чуть позже.
Среднее время поиска — это время, которое требуется головке (части, которая считывает данные), чтобы достичь области на диске, на которой хранятся эти данные. Голова должна перемещаться по области хранения, чтобы найти целевые данные. Вы должны усреднить время записи и поиска записи, чтобы найти среднее время поиска.
Большинство этих оценок выставляются производителями. Как правило, жесткий диск имеет диапазон IOPS от 55 до 180, а SSD — от 3000 до 40 000 IOPS.
Разным приложениям для правильной работы требуются разные IOPS и размеры блоков. Одно приложение может даже иметь разные компоненты, которые функционируют в разных диапазонах размеров блоков. Крайне важно проверять рекомендации поставщиков программного обеспечения в отношении размера блока и производительности.
Размеры блоков
Блок свободно преобразуется в любую часть данных. Файловые системы записывают целые блоки данных, а не отдельные биты и байты.Блок файловой системы может растянуться на несколько секторов, которые являются разделами физического диска. Блоки — это абстрактные представления аппаратных средств, которые могут (или не могут) быть кратны физическому размеру блока. Каждый файл занимает один блок независимо от его размера, поэтому выбор правильного размера блока для эффективного использования хранилища может существенно повлиять на производительность.
Например. Сервер SQL регистрирует блоки по 64 КБ, в то время как Windows Server может использовать блоки по 4 КБ, а базовый гипервизор vSphere использует блоки по 1 МБ. Как вы увидите, размер блока и количество операций ввода-вывода в секунду оказывают лавинообразное влияние на пропускную способность сетевого трафика.
Небольшие размеры блоков предпочтительнее для большого объема файлов меньшего размера, потому что вы более эффективно используете хранилище (помните, что даже маленькие файлы должны занимать весь блок — поэтому файл, состоящий всего из пары байтов, будет использовать весь блок). блок размером 4 КБ).
Вам нужно спроектировать хранилище таким образом, чтобы оно правильно выровнялось в соответствии с несколькими базовыми секторами. Например, четыре сектора по 4 КБ уместятся в блоке 16 КБ, который хорошо умещается в полосе размером 64 КБ. В противном случае вы столкнетесь с дополнительной задержкой и вам придется часто выполнять дефрагментацию, поскольку ваши блоки будут перекрывать разные блоки и сектора (и, возможно, даже диски в массиве хранения) при чтении и записи. vSphere 5.0 и более поздние версии автоматически согласуются с блоком размером 1 МБ, как указано выше.
Хорошо, а как насчет пропускной способности?
Пропускная способность измеряет скорость передачи данных на носитель и обратно в мегабайтах в секунду. Хотя ваша пропускная способность является мерой общей возможной скорости перемещения данных по сети, на пропускную способность могут влиять IOPS и размер пакета. Сетевой протокол также может изменить общую пропускную способность. Это измерение конечного объема данных, которые фактически перемещаются по сетевому пути, а пропускная способность — это потенциальная пропускная способность пути без каких-либо смягчающих факторов.
Поэтому IOPS может стать узким местом для пропускной способности. Вполне вероятно, что ваш ЦП и память не будут ограничивающим фактором, поскольку они могут обрабатывать больше информации в секунду, чем большинство устройств хранения и сетей.
Последовательно подключенное устройство хранения данных может иметь максимальную пропускную способность до 2812 МБ/с, в то время как Ethernet достигает 12 500 МБ/с, а оптоволоконные сети – 4000 МБ/с.
Размер и количество блоков, проходящих через сеть, могут существенно повлиять на пропускную способность. Блок размером 1 МБ будет проходить по сети дольше, но вы не сможете переместить столько блоков. Блок размером 4 КБ будет перемещаться очень быстро, но вы, скорее всего, столкнетесь с большим объемом.
Учитывая все это, крайне важно планировать в соответствии с рекомендациями производителя и разработчиков, а также с реальными эталонными показателями, чтобы максимизировать производительность вашего хранилища (и, следовательно, приложений). Взгляните на пиковые показатели IOPS и пропускной способности, коэффициенты чтения/записи, штрафы RAID и физическую задержку. Один из наших инженеров по облачным вычислениям также будет рад помочь вам выбрать подходящий уровень облачного хранилища для каждого из ваших приложений.
Ян Пол
Иэн Пол
Писатель
Ян Пол — независимый писатель, который более десяти лет пишет о технологиях. Помимо написания статей для How-To Geek, он регулярно участвует в PCWorld в качестве критика, автора статей, репортера, охотника за сделками и обозревателя. Его работы также публиковались в Интернете в The Washington Post, ABC News, MSNBC, Reuters, Macworld, Yahoo Tech, Tech.co, TechHive, The Huffington Post и Lifewire. Его статьи регулярно публикуются на многочисленных сайтах IDG, включая CIO, Computerworld, GameStar, Macworld UK, Tech Advisor и TechConnect. Подробнее.
PNY
Когда речь заходит о компонентах ПК, все зависит от производительности. Но значение некоторых показателей производительности может быть очень неясным, включая сегодняшнюю тему операций ввода-вывода в секунду (IOPS). Что такое IOP и стоят ли они вашего внимания?
Объяснение производительности накопителя
Для вашего ПК доступно два основных типа накопителей: жесткие диски (HDD) и твердотельные накопители (SSD). Первые — это хорошо известные традиционные дисководы для ПК с вращающимися пластинами и головкой чтения/записи, которая располагается над пластинами для извлечения данных или добавления новых данных. Между тем твердотельные накопители не имеют движущихся частей, что значительно ускоряет извлечение и хранение данных.
Из-за этой разницы мы можем заметить увеличение производительности, просто заменив жесткий диск на твердотельный накопитель.Но если мы хотим лучше понять эти различия в скорости или различия между двумя дисками одного типа, нам нужны числа, и именно здесь вступают в действие IOP.
Производительность накопителя для ПК обычно выражается двумя способами: производительность при последовательном чтении/записи и производительность при случайном чтении/записи. Последовательное чтение/запись измеряет, насколько быстро диск может получить доступ к большим фрагментам данных, которые расположены рядом друг с другом на диске, например к большому видеофайлу. С другой стороны, произвольное чтение/запись противоположно последовательному. Это происходит, когда система захватывает файлы меньшего размера, которые могут находиться в разных частях диска, например, при одновременном открытии нескольких файлов и программ.
Последовательные операции чтения и записи обычно выражаются с точки зрения пропускной способности диска в мегабайтах в секунду. В то же время случайная производительность обычно выражается в IOP.
Что такое IOP?
Фирекуда
Мы уже говорили, что IOP означает количество операций ввода-вывода в секунду, но что это значит? Это показатель того, сколько задач (чтение и запись данных) накопитель может выполнять каждую секунду. Проще говоря, чем выше число операций ввода-вывода в секунду, тем лучше работает диск, но это никогда не бывает так просто. На результат IOP может повлиять несколько факторов, таких как размер блоков данных для теста и глубина очереди (сколько запросов данных ожидают обработки во время теста). Есть и другие факторы, которые следует учитывать, например, отражает ли количество операций ввода-вывода в секунду случайную операцию чтения, случайную операцию записи или их сочетание.
В обзорах накопителей вы можете увидеть следующее предложение: "Случайные операции чтения и записи 4 КБ оцениваются в 1,5 миллиона и до 1,8 миллиона операций ввода-вывода в секунду при смешанном произвольном соотношении 70/30". Это предложение было взято из статьи PCWorld о твердотельном накопителе Intel P5800X для центров обработки данных. Это означает, что блок тестовых данных, которые записывались или читались, составлял 4 килобайта, а затем тест проверял, сколько раз в секунду этот объем данных может быть записан или прочитан. Тесты чтения и записи для P5800X достигли максимума в 1,5 миллиона операций в секунду (для версии этого диска с большей емкостью), в то время как сочетание 70 процентов операций чтения и 30 процентов операций записи увеличило максимальную производительность операций ввода-вывода до 1,8 миллиона.< /p>
Сложности с IOP
В идеальном мире вы могли бы посмотреть, какое количество операций ввода-вывода в секунду указано в спецификации, и легко сравнить один диск с другим. Однако это не так. Во-первых, нам нужно знать размер данных, используемых во время теста IOP. Обычно публикуемые числа IOP используют 4 КБ (4 килобайта), но они также могут использовать большие размеры. Убедитесь, что вы сравниваете одинаковый объем тестовых данных, так как это может изменить показатели производительности.
Еще одна проблема с IOP — глубина очереди. Многие опубликованные тесты имеют глубину очереди 32, что означает 32 запроса данных, ожидающих записи. Производителям нравятся тесты с большей глубиной очереди, потому что чем больше данных нужно прочитать, тем эффективнее работают диски.
Если ваш накопитель обычно имеет глубину очереди 32, то это хороший показатель, поскольку он дает вам реалистичное представление о производительности вашей машины. Проблема в том, что домашнему ПК будет сложно получить такой объем данных в очереди даже под нагрузкой. Это означает, что домашние пользователи вряд ли увидят более высокую эффективность, указанную в тестах QD32.
Если рассматривать производительность накопителя по количеству операций ввода-вывода в секунду, более важным будет тест с глубиной очереди, равной 1. Легко ли найти тест QD1, зависит от производителя. Взгляните на эту веб-страницу для Samsung 980 Pro, например, вы можете найти случайное чтение и запись 4 КБ, тесты QD1, которые максимально достигают 60 000 операций ввода-вывода в секунду. Однако в техническом описании Seagate FireCuda 530 показаны только тесты QD32 размером 4 КБ.
Так стоит ли вам сравнивать диски, если все, что вы можете найти, это тесты QD32? Нет. Результаты Seagate показывают 1 миллион операций ввода-вывода в тестах 4 КБ QD 32, как и Samsung 980 Pro. Это делает его размытым на бумаге для более высокой производительности. Однако, если вы ознакомитесь со сторонними обзорами, они обычно говорят о FireCuda 530 как о более эффективном диске для домашних пользователей.
Покупка пропускной способности
Что нам делать со всей этой информацией? Действительно ли измерения IOP бесполезны для покупателя домашнего ПК? Если и удастся найти 4KB QD1 или, в крайнем случае, QD8 тесты от производителей, то не обязательно.Но, как и во всем остальном во вселенной ПК, если вы хотите сделать осознанную покупку важного компонента, вам необходимо проконсультироваться с несколькими сторонними обзорами с аналогичными тестами IOP, а затем обобщить их выводы, чтобы определить наиболее производительный диск. можно получить за ваш бюджет.
Несмотря на то, что твердотельные накопители нашли широкое применение у потребителей, они, к сожалению, сгруппированы в ту же картину, что и жесткие диски, хотя бы потому, что они рассматриваются как хранилище и не более того. И размер, и демография нашей читательской аудитории ясно рисуют эту картину, однако существует удивительная возможность сделать наших читателей еще на шаг вперед; возможность показать, почему у нас может быть такая страсть к тому, что многие считают очень засушливым районом. В этом сегменте раздела «Учимся работать с флэш-памятью» давайте познакомимся с «большой тройкой» производительности твердотельных накопителей, а именно с пропускной способностью, задержкой и операциями ввода-вывода в секунду.
ПОНИМАНИЕ БОЛЬШОЙ 3
Система хранения данных (SSD, HDD) любого компьютера является самой медленной частью по сравнению с любым другим важным компонентом, таким как ЦП, память DRAM или видеокарта. Память DRAM может передавать данные со скоростью более 20 гигабайт в секунду (ГБ/с). Центральные процессоры и процессоры видеокарт могут выполнять свои внутренние инструкции миллиарды раз в секунду. Между тем, большинство накопителей способны в лучшем случае обрабатывать несколько сотен мегабайт данных в секунду (МБ/с). Большинство, если не все аппаратное и программное обеспечение, работающее на ПК, ждут данных с устройств хранения гораздо дольше, чем из любого другого источника. Когда мы видим показатель МБ/с или даже ГБ/с, мы определяем скорость передачи данных или пропускную способность.
Скорость передачи данных — не единственный важный аспект производительности устройства хранения. на самом деле это вторично. Время, необходимое для передачи данных в BEGIN, называемое задержкой, еще более важно. Медленное перемещение данных из одной системы в другую снижает производительность, но время, необходимое для начала перемещения данных, когда не выполняется никакой полезной работы, является огромным фактором производительности устройств хранения данных.
Есть еще один аспект производительности устройства хранения данных, который не менее важен, чем задержка. Именно так ЧАСТО запоминающее устройство может выполнять передачу данных. Сколько операций ввода-вывода (IO) может выполняться устройством хранения каждую секунду, или IOPS, является очень важным показателем его производительности, которым слишком часто пренебрегают. Пропускная способность кажется «измерителем» для потребителя, а задержка и количество операций ввода-вывода в секунду являются неотъемлемыми инструментами измерения при переходе на предприятие и даже в пространство центра обработки данных.
Наши три основные области производительности, как часто могут выполняться операции ввода-вывода, сколько времени требуется для запуска задачи ввода-вывода, а также скорость передачи данных в устройство хранения или из него, в компьютерной индустрии определяются следующим образом:
- Как часто устройство хранения может выполнять задачи ввода-вывода, измеряется количеством операций ввода-вывода в секунду (IOPS) и зависит от типа выполняемого ввода-вывода. Чем больше число операций ввода-вывода в секунду, тем выше производительность.
- Сколько времени требуется устройству хранения для запуска задачи ввода-вывода, или задержка, измеряется в долях секунды. Чем меньше время задержки, тем лучше.
- Скорость, с которой данные передаются из устройства хранения или в него, измеряется в байтах в секунду, обычно в килобайтах и мегабайтах в секунду. Нам всем нужно больше мегабайт в секунду.
Большая тройка (пропускная способность, задержка и IOPS) — это то, что действительно указывает на производительность устройства хранения. Давайте расширим наше понимание производительности жестких дисков и твердотельных накопителей за пределы просто МБ/с или пропускной способности, поскольку это только одна часть истории производительности. Используя бесплатный и очень простой в использовании тест AS SSD, мы можем сравнить жесткий диск и твердотельный накопитель, внимательно изучив «Большую тройку».
СРАВНЕНИЕ ПРОИЗВОДИТЕЛЬНОСТИ HDD/SSD
AS SSD — это основа синтетических тестов SSD, поскольку он считывает и записывает несколько гигабайт данных на диск и с него. Напоминаем, что на выполнение теста AS SSD на жестком диске ушло чуть больше часа, а на твердотельный накопитель - менее пяти минут.
Результаты для жесткого диска показаны слева, а для твердотельного накопителя — справа.
операций ввода-вывода в секунду
IOPS показывает, насколько быстро каждый диск может обрабатывать запросы ввода-вывода. Первая строка — это количество операций ввода-вывода в секунду при чтении и записи файла размером 16 МБ, последовательного ввода-вывода большого файла. Разница между HDD и SSD невелика, SSD может выполнять в 3,4 раза больше запросов чтения IOP, чем HDD. IOPS и скорость последовательной записи больших файлов аналогичны скорости чтения, SSD примерно в 3,5 раза быстрее, чем HDD.
Следующая строка — это небольшой файл размером 4 КБ, который «случайно» считывает и записывает IOPS. Случайное означает, что файлы разбросаны по всему диску, а не аккуратными рядами или группами, поэтому потребуется больше усилий, чтобы найти их. Произвольный ввод-вывод — самый сложный и трудоемкий тип, с которым приходится иметь дело устройству хранения.Здесь мы видим, что HDD может выполнять 176 операций ввода-вывода в секунду, а SSD дает нам 9417 операций ввода-вывода в секунду, или более чем в 53 раза больше запросов на чтение. Поскольку чтение небольших файлов и 4K является наиболее частым вводом-выводом при обычном использовании ПК, эта разница показывает, насколько быстрее SSD может быть для пользователя. IOPS записи 4K демонстрирует потрясающую разницу в производительности: HDD 311 IOPS, SSD 32 933 IOPS или более чем в 105 раз быстрее. Может ли такая производительность не быть замечена пользователем?
Тест AS SSD «4K-64Thrd» в следующей строке — это проверка способности накопителя использовать функцию Native Command Queuing (NCQ) AHCI. NCQ просто предоставляет приводу прямой доступ к 32 запросам ввода-вывода в памяти системы, при этом на привод отправляется только одна команда ввода-вывода вместо 32 команд ввода-вывода, по одной на каждый запрос ввода-вывода. Это устраняет все накладные расходы, связанные с обработкой 32 отдельных команд. «4K» — это размер файла, ввод-вывод случайный, как описано выше, а «64Thrd» (64 потока) означает, что в тесте выполняется два 32 запроса ввода-вывода типа NCQ.
Читайте также: