Сколько памяти занимает 1 страница текста

Обновлено: 21.11.2024

Мы часто слышим такие слова, как гигабайт (ГБ) и терабайт, но что на самом деле мы можем сделать с таким объемом памяти? На самом базовом уровне вычислений у нас есть биты, которые будут либо 1, либо 0. Байт — это 8 бит. Мы собираемся представить байт в виде этой точки:

4 байта — это память, необходимая для хранения 1 символа, поэтому 1 байт — довольно хорошая отправная точка. На одной странице текста около 500 символов. Мы можем заменить 500 символов на 2000 байт, или около двух килобайт памяти.

Если мы делаем визуальное представление, это 2000 точек.

Это всего 2 килобайта памяти. Всего за 1 страницу текста. Что происходит, когда мы смотрим роман? 40000 слов — это примерно 80 страниц текста или 160 килобайт памяти. Давайте посмотрим, как это выглядит в виде точки.

Вау! Это много точек, но с точки зрения компьютерной памяти это небольшая игра. Перейдем сразу к 1 мегабайту (МБ) памяти. 1 мегабайт — это примерно 6 секунд несжатого аудио, 1 минута аудио в формате MP3 со скоростью 128 кбит/с или 500-страничная книга. Мегабайт равен 1000 килобайт (КБ). Вот как это выглядит в виде точки:

Это 1 миллион байт. Но на самом деле это не так много памяти для нетекстовых приложений. 1 минута аудио на самом деле не доставляет особого удовольствия. 4 мегабайта — это размер картриджа Nintendo 64, CD-ROM — 700 мегабайт (42 минуты несжатого аудио). Гигабайт — это то, с чего мы начинаем переходить к более «стандартному» хранилищу.

На точечных диаграммах при увеличении масштаба можно увидеть отдельные точки на мегабайтах. В гигабайтах это невозможно. Количество точек у нас увеличилось на 1000. Это очень много памяти, в 1 ГБ 1 миллиард байт, а в каждом байте 8 бит, значит, в 1 ГБ 8 миллиардов бит памяти (ВАУ!). Несмотря на все это волнение, 1 ГБ на самом деле не так много памяти, в современных терминах это уже не так. В предыдущем сообщении в блоге я сфотографировал наши USB-накопители.

Много памяти.

Я хотел, чтобы вы могли увеличить каждую отдельную точку, но мой компьютер сильно тормозил в диапазоне 160 КБ, поэтому мне пришлось изменить размер всего.

Каждый из них имеет 4 или 8 гигабайт памяти, поэтому, если вы посмотрите на него, все они имеют точечную диаграмму гигабайта и как минимум в 4 раза больше.
Для сравнения, Google проиндексировал 200 терабайт (1 терабайт равен 1000 гигабайтам) Интернета. По их оценкам, это всего лишь 0,004% всего Интернета, то есть около 5 000 000 терабайт памяти. Пять миллионов терабайт — это 5000 петабайт.

Размер информации в компьютере измеряется в килобайтах, мегабайтах и ​​гигабайтах. В этом разделе мы рассмотрим распространенные размеры, которые можно встретить в реальной жизни.

Килобайт или КБ

  • Килобайт КБ – около 1 000 байт
  • Небольшой текст электронной почты составляет около 2 КБ.
  • 5-страничный документ может занимать 100 КБ.
  • Для хранения текста требуется не так много байтов, как для изображений или видео.

Один килобайт (КБ) – это совокупность примерно 1000 байт. Страница обычного латинского алфавитного текста занимает для хранения около 2 килобайт (около одного байта на букву). Типичное короткое электронное письмо также занимает всего 1 или 2 килобайта. Текст является одним из наиболее естественно компактных типов данных, для хранения каждой буквы требуется около одного байта. В нелатинских алфавитах, таких как кандзи, хранилище занимает 2 или 4 байта на «букву», что все еще довольно компактно по сравнению с аудио и изображениями.

Мегабайт или МБ

  • Мегабайт (МБ) – около 1 миллиона байт.
  • около 1000 КБ
  • Скорость звука в формате MP3 составляет около 1 МБ в минуту.
  • Цифровое изображение высокого качества весит около 2–5 МБ.

Один мегабайт равен примерно 1 миллиону байт (или примерно 1000 килобайт). Аудиофайл MP3 длительностью несколько минут или изображение размером 10 миллионов пикселей с цифровой камеры обычно занимают несколько мегабайт. Эмпирическое правило для MP3-аудио гласит, что 1 минута аудио занимает около 1 мегабайта. Аудиоданные, изображения и видеоданные обычно хранятся в «сжатой» форме, например MP3. Мы поговорим о том, как работает сжатие позже. Компакт-диск с данными хранит около 700 МБ. Звук на компакт-диске не сжат, поэтому он занимает гораздо больше места, чем MP3. Серия битов представлена ​​в виде спиральной дорожки крошечных ямок в серебряном материале диска. Представьте, что каждая ямка интерпретируется как 0, а отсутствие ямки — 1 при чтении последовательности спирали. Забавный факт: вся спираль на компакт-диске имеет длину более 5 км.

Гигабайт или ГБ

  • Гигабайт ГБ = около миллиарда байтов
  • около 1000 МБ
  • Современное оборудование стандартного размера
  • 4000 МБ = 4 ГБ
  • Обычный компьютер в 2012 году мог иметь 4 ГБ или ОЗУ.
  • Диск DVD имеет емкость 4,7 ГБ (один слой)
  • – Цифра – 2 ГБ видео в час (сильно различается).
  • Вместимость флэш-накопителя может составлять 16 ГБ.
  • На жестком диске может быть 750 ГБ.

Один гигабайт (ГБ) равен примерно 1 миллиарду байт или 1 тысяче мегабайт. Типичный жесткий диск в 2012 году вмещает около 750 ГБ. Компьютер может иметь 4 ГБ оперативной памяти. Карта флэш-памяти, используемая в камере, может хранить 4 ГБ. DVD-фильм занимает примерно 4–8 ГБ.

Терабайт или ТБ

Один терабайт (ТБ) составляет около 1000 гигабайт, или примерно 1 триллион байт. Жесткие диски емкостью 1 ТБ и 2 ТБ можно купить уже сегодня, поэтому время, когда этот термин войдет в обиход, только начинается. Термин «гигабайт» тоже был редкостью, пока закон Мура не сделал его общепринятым.

Гигагерцы — скорость, а не байты

Один гигагерц – это 1 миллиард циклов в секунду (мегагерц – миллион циклов в секунду). Гигагерц — это мера скорости, грубо говоря, скорость, с которой процессор может выполнять простейшую операцию в секунду. Гигагерц точно не говорит вам, как быстро ЦП выполняет работу, но примерно коррелирует. ЦП с более высокой частотой гигагерца также, как правило, дороже в производстве, и они потребляют больше энергии (и, как следствие, выделяют больше тепла) ... проблема для размещения быстрых ЦП в небольших устройствах, таких как телефоны. Компания ARM славится тем, что выпускает очень производительные чипы при минимальном энергопотреблении и нагреве. В настоящее время почти все сотовые телефоны используют процессоры ARM.

Проблемы с килобайтами, мегабайтами и гигабайтами

Сегодня любому человеку должно быть удобно выполнять простые арифметические действия для вычисления размеров в МБ/ГБ, например, в следующих текстовых задачах:

Да, подходит: 600 МБ + 700 МБ — это 1300 МБ. 1300 МБ — это 1,3 ГБ, поэтому на 2-ГБ диск поместится без проблем. Эквивалентно мы могли бы сказать, что на диске объемом 2 ГБ есть место для 2000 МБ, поэтому 1300 МБ подходят.

Аудио в формате MP3 занимает около 1 МБ в минуту. 20 часов, 60 минут/час, 20 * 60 дает 1200 минут. Это около 1200 МБ, что составляет 1,2 ГБ.

800 x 600 – это 480 000 пикселей. Каждый пиксель занимает 3 байта (по одному байту для красного/зеленого/синего), поэтому 480 000 * 3 — это всего 1 440 000 байт, т. е. около 1,4 МБ — это пространство, необходимое для изображения в ОЗУ. Вы заметите, что на диске файлы .jpg занимают гораздо меньше места; это связано с "сжатием", которое является очень эффективным методом уменьшения пространства для изображений и аудиоданных - тема будущего.

Альтернативный термин: Кибибайт Мебибайт Гибибайт Тебибайт

Когда я говорю "около тысячи".. 1000 или 1024? Существуют две схемы: система «1000» и система «1024». В результате определения МБ ГБ ТБ различаются до 10%. Для этого класса я готов игнорировать этот уровень детализации и думать о факторах как о «около тысячи». Дополнительные сведения об этой проблеме см. ниже.

Память на компьютерах HP измеряется в битах, байтах, словах, страницах, секторах, мегабайтах и ​​гигабайтах, а также в других единицах измерения.

Чтобы узнать, как используется память, запустите Pages Memory Monitor. В MPE V дисковое пространство управлялось секторами по 256 байт, и MPE / iX также часто относится к секторам. Просто помните, что страница программного обеспечения состоит из 16 секторов.

Сектор

Сектора — это архаичная мера дискового пространства, иногда используемая в MPE. Например, команды :Listf и :Listfile показывают дисковое пространство, выделенное для файлов в секторах. Сектор 256 байт. Просто помните, что дисковое пространство MPE/iX фактически распределяется программными страницами, которые равны 16 секторам.

Байт состоит из восьми битов и может содержать значение от 0 до 255 (от 2 до 8-й степени, меньше 1). Бит означает двоичную цифру или числовой разряд, который может иметь только два значения: 0 или 1. Помните, что HP нумерует биты слева, начиная с нуля.

Слово — это основная единица доступа к памяти компьютера на конкретной машине, обычно это размер каждой инструкции и размер значения данных, которое обрабатывается наиболее эффективно. Слово на машине PA-RISC имеет длину 32 бита (4 байта), а слово на машине Classic HP 3000 — 16 бит (2 байта). Байт равен 8 битам, а 16 бит на машинах PA-RISC называются полусловом. Существуют машинные инструкции для загрузки и хранения слов, полуслов и байтов.

Полуслово

Килобайт

Мегабайт

Мегабайт (МБ) – это объем памяти, равный 1 048 576 байтам (1024 умножить на 1024), или 2 в 20-й степени. Мегабайт равен 4096 MPE-секторам, 512 аппаратным страницам PA-RISC или 256 программным страницам MPE/iX. 1024 мегабайта это гигабайт.

Гигабайт

Гигабайт (ГБ) — это мера объема памяти, равная 1024 мегабайтам или 1 073 741 824 байтам (2 в 30-й степени). Гигабайт равен 4 194 304 секторам MPE, 524 288 аппаратным страницам PA-RISC или 262 144 программным страницам MPE/iX.

Экстенты — это фрагменты дискового пространства

Дисковое пространство измеряется и распределяется по-разному в разных операционных системах.MPE номинально измеряет пространство в 256-байтовых секторах и размещает файлы в единицах непрерывного пространства, называемых экстентами. MPE/iX на самом деле выделяет пространство кратно 4096-байтовым страницам, а не секторам, но продолжает измерять пространство в секторах для обратной совместимости.

Экстенты — это функция MPE/iX, оставшаяся от MPE V. Их можно почти, но не полностью игнорировать. В MPE V все экстенты должны быть одинакового размера (кроме последнего), а максимальное количество на файл — 32. Это может затруднить поиск достаточно больших фрагментов свободного дискового пространства для большого файла данных. В MPE/iX файл может иметь неограниченное количество экстентов, и они не обязательно должны быть одного размера. Многие файлы MPE/iX, такие как файлы Obj, имеют размер записи 256 байт, предел записи 4 096 000 и неограниченные экстенты.

Стэн Зилер отмечает, что экстенты на самом деле не неограниченны:

Хотя жестко запрограммированного ограничения нет, оказывается, что количество экстентов для одного файла ограничено, по крайней мере, максимальным размером таблицы меток (поскольку все экстенты записываются в таблицу меток). Стол). Таблица меток не имеет жестко запрограммированного ограничения на количество записей, но может содержать не более 20 экстентов, все на одном диске. Во всяком случае, я предполагаю, что приблизительное ограничение на количество экстентов (при наличии большого диска и отсутствии других файлов в таблице меток!) составляет около 15 728 100 экстентов. :)

Промежуточное место на диске

В MPE дисковое пространство измеряется в секторах и выделяется для файлов в экстентах. Используйте :dstat all, чтобы отобразить дисководы в вашей системе MPE. Используйте :discfree для изучения использования дискового пространства и :report nogroup.@ для вывода дискового пространства, используемого всеми учетными записями в вашей системе. Используйте команду MPEX %listf @.@.@(sectors>10000 и accdate), чтобы найти большие файлы, которые не использовались в течение 90 или более дней.

HP-UX измеряет пространство блоками по 1024 байта в bdf и блоками по 512 байт в df. Команда df представляет собой стандартный отчет UNIX о свободном месте на диске. bdf — более удобная форма Беркли df, поставляемая с HP-UX; он показывает свободное и используемое дисковое пространство в каждой файловой системе (не включает пространство подкачки и другое служебное дисковое пространство). Вот пример вывода bdf:

Файловые системы /vg00 — это логические подразделения жесткого диска, распределенные по разным подкаталогам в корневом каталоге. Идея аналогична лимитам учетных записей и групп в MPE. Файловая система дамбо представляет собой сервер ПК в локальной сети, смонтированный как сетевая файловая система в UNIX. И последние два — это приводы CD-ROM с установленными руководствами по HP-UX и MPE. Столбец емкости эквивалентен максимальному проценту Perm MPE/iX, в котором 100 процентов не означает, что диск заполнен. HP-UX обычно заставляет диск выглядеть заполненным на 100 процентов, хотя на самом деле он заполнен примерно на 90 процентов. Остальные 10 процентов предоставляются только суперпользователю.

bdf сообщает о свободных килобайтах на файловую систему HP-UX. См. /etc/checklist/ для всех файловых систем, известных вашей системе HP-UX, и /etc/mnttab/ для всех смонтированных файловых систем. Дисковое пространство управляется как «файлы устройств»; см. /dev/dsk/* для всех дисковых устройств. Когда у вас заканчивается место на диске, вы видите ошибку «Нет свободного места на устройстве». Чтобы узнать, кто использует дисковое пространство в HP-UX, попробуйте du -s /users/* . Это показывает, сколько 512-байтовых блоков используется каждым подкаталогом в /users .

Фрагментация

Операционные системы выделяют дисковое пространство фрагментами при создании и расширении файлов и временного дискового пространства (области подкачки и т. д.). Когда файлы очищаются, эти фрагменты высвобождаются для повторного использования. Со временем дисковое пространство может быть «фрагментировано» на множество мелких частей, что может снизить производительность и надежность системы.

Чтобы наблюдать и исправлять фрагментацию MPE на MPE, используйте продукт De-Frag/X от Lund Performance Software или используйте команду Contigvol программы Volutil MPE/iX 5.0 (она создает непрерывное свободное дисковое пространство на томе; Contigvol работает примерно так же, как VINIT CONDense, то есть он стабилен и надежен, но требует многократных проходов для получения наилучших результатов).

Чтобы узнать все о фрагментации, см. статью Стэна Зилера "Анализ и устранение проблем фрагментации". Вот пример отображения фрагментации диска с помощью De-Frag/X. (Вы также можете увеличить отдельный фрагмент экрана.)

Мегабайты диска по сравнению с мегабайтами оперативной памяти

Память диска измеряется производителями дисков иначе, чем память RAM. Дисковое пространство обычно использует мегабайт для обозначения 1 000 000 байт и гигабайт для обозначения 1 000 000 000 байт. HP делает это, как и многие другие производители дисков. Производители компьютеров используют мегабайт для обозначения 1 048 576 байт, а гигабайт — 1 073 741 824 байт. Таким образом, 1 МБ основной памяти не помещается в 1 МБ пространства подкачки на диске!

Стандарты МЭК: двоичные и десятичные числа

"В 1998 году Международная электротехническая комиссия утвердила международные стандартные имена и символы для префиксов для ДВОИЧНЫХ кратных:"

"Сравнивая их с префиксами DECIMAL, мы обнаруживаем, что:

один кибибайт (1 КиБ) = 2 в степени 10 байт = 1024 Б; но один килобайт (1 КБ) = 10 в степени 3 байта = 1000 Б;

один мегабайт (1 МиБ) = 2 в степени 20 байт = 1 048 576 Б; один мегабайт (1 МБ) = 10 в степени 6 байт = 1 000 000 Б.

один гибибайт (1 ГиБ) = 2 в степени 30 байт = 1 073 741 824 Б; один гигабайт (1 ГБ) = 10 в степени 9 байт = 1 000 000 000 Б. и т.д.

"Итак, префикс "кило" означает 1 000 (а не 1 024, как указано на вашей веб-странице), мега – 1 000 000 (не 1 048 576 или 2 в 20-й степени), гига – 1 000 000 000 и т. д."

Спасибо, Бранислав. Вот несколько веб-сайтов, на которых обсуждается этот вопрос:

"Однажды компьютерные специалисты заметили, что 2^10 почти равно 1000, и начали использовать префикс SI "кило" для обозначения 1024. Это работало достаточно хорошо в течение десятилетия или двух, потому что все, кто говорил о килобайтах, знали что термин подразумевает 1024 байта, но почти в одночасье гораздо большее количество «всех» купило компьютеры, и специалистам по компьютерной торговле нужно было разговаривать с физиками и инженерами и даже с обычными людьми, большинство из которых знает, что километр — это 1000 метров и килограмм равен 1000 граммов."

"Тогда хранение данных в гигабайтах и ​​даже терабайтах стало практичным, а устройства хранения не были построены на двоичных деревьях, что означало, что для многих практических целей двоичная арифметика была менее удобной, чем десятичная арифметика. В результате сегодня «все» не «знают», что такое мегабайт.Обсуждая компьютерную память, большинство производителей используют мегабайт для обозначения 2 ^ 20 = 1 048 576 байт, но производители компьютерных запоминающих устройств обычно используют этот термин для обозначения 1 000 000 Некоторые проектировщики локальных сетей использовали мегабит в секунду для обозначения 1 048 576 бит/с, но все инженеры по телекоммуникациям используют его для обозначения 106 бит/с. И если двух определений мегабайта недостаточно, третий мегабайт 1 024 000 байт — это мегабайт, используемый для форматирования знакомой нам 90-миллиметровой (3 1/2 дюйма) дискеты «1,44 МБ». Путаница реальна, как и вероятность несовместимости стандартов и реализованных систем."

"5 гигабайт (ГБ) должны означать ровно 5 000 000 000 байт, а 5 гигабайт (ГиБ) должны означать ровно 5 368 709 120 байт. Судьба этого новшества неясна. Пока мало кто использует Двоичные префиксы IEC. Их поиск в Интернете приводит, в основном, к жалобам людей, которые не хотят их использовать."

"По состоянию на 2003 год это соглашение об именах еще не получило широкого распространения. IEC не давала имен для префиксов, кроме exa-, но если бы они дали им имена, они, вероятно, также были бы zebi- и yobi-. как ноби- и догби-."

Хотя точное количество текстовых данных в килобайте (КБ) или мегабайте (МБ) может варьироваться в зависимости от характера документа, килобайт может содержать около половины страницы текста, а мегабайт — около 500 страниц. текста. Текст в цифровом файле преобразуется в двоичные данные, которые обозначают буквы и цифры с помощью выражений из единиц и нулей. Файлы большего размера содержат больше этих данных, что, в свою очередь, эквивалентно большему количеству типизированной информации.

Один мегабайт может содержать около 500 страниц текста, что сопоставимо с одной толстой книгой.

Двоичные файлы и биты

Большинство современных компьютеров представляют собой двоичные системы и работают с битами данных. Бит — это самая основная единица информации, которая может иметь два состояния: обычно указывается как 0 или 1. Длинные строки этих битов могут представлять большинство типов информации, включая текст, изображения и музыку. Однако чистая двоичная информация бесполезна для людей, которые не научились читать и писать в двоичном формате. Двоичное число 11000101110, например, эквивалентно 1582.

Планшетный компьютер может иметь гигабайты памяти, способные хранить тысячи книг.

Группировка битов в байты

Чтобы сделать данные более доступными и упрощенными, группы битов объединяются в байты. один байт состоит из 8 бит. Набор из 8 битов был выбран потому, что он обеспечивает 256 возможных вариантов, что достаточно для указания букв, цифр, пробелов, знаков препинания и других расширенных символов. Само это предложение, например, состоит из 125 байтов, потому что в нем 125 букв, цифр, пробелов и знаков препинания.Имейте в виду, что это представляет собой только чистый текст; некоторые текстовые редакторы включают в себя другие типы данных форматирования, поэтому размер файла становится больше, чем просто количество символов в файле.

Большинство компакт-дисков содержат около 750 мегабайт данных.

Количество текста

Килобайт — это 1 024 байта, часто для простоты округляемых до 1 000; в то время как мегабайт составляет 1 048 576 байтов, или около 1 миллиона. Подсчитано, что килобайт может вместить около половины машинописной страницы. Поэтому для одной полной страницы требуется около 2 КБ. На следующей диаграмме показано количество байтов в общепринятых терминах, таких как килобайты и мегабайты, а также объем текста, который может храниться в каждом из них.

< td>Мегабайт (МБ)
Имя Количество байтов Количество текста
Килобайт (КБ) 2 10 или 1024 1/2 страницы
2 20 или 1 048 576 500 страниц или 1 толстая книга
Гигабайт (ГБ) 2 30 или 1 073 741 824 500 000 страниц или 1000 толстых книг
Терабайт (ТБ) 2 40 или 1 099 511 627 776 1 миллион толстых книг
Петабайт 2 50 или 1 125 899 906 842 624 180 библиотек Конгресса< /td>
Exabyte 2 60 или 1 152 921 504 606 846 976 180 тысяч библиотек Конгресса
Zettabyte 2 70 или 1 180 591 620 717 411 303 424 180 миллионов библиотек Конгресса
Yottabyte 2 80 или 1 208 925 819 614 629 174 706 176 180 миллиардов библиотек Конгресса

Библиотека Конгресса

Библиотека Конгресса в Вашингтоне, округ Колумбия, считается крупнейшей в мире библиотекой с более чем 28 миллионами томов. Цифры, указанные в приведенной выше таблице, основаны на предположении, что средняя книга состоит из 200 страниц. Это означает, что для хранения цифровой резервной копии всей Библиотеки Конгресса потребуется около 28 ТБ дискового пространства.

Портативное хранилище мультимедиа

Большинство компакт-дисков (CD) содержат около 750 МБ, что примерно эквивалентно 375 000 страниц текста. Цифровые универсальные диски (DVD) могут хранить 4,7 ГБ или 2,3 миллиона страниц. Диски Blu-Ray могут содержать 27 ГБ или 13,5 миллионов страниц, что примерно эквивалентно тексту, содержащемуся в 67 500 книгах. Такие устройства, как электронные книги и планшетные компьютеры, часто имеют многогигабайтную память, что делает их идеальными для хранения тысяч книг.

Гигабайт может содержать информацию, эквивалентную примерно 1000 толстых книг.

Читайте также: