Данные в памяти компьютера представлены в виде

Обновлено: 21.11.2024

От простых каменных табличек и наскальных рисунков до написанных слов и канавок фонографа люди постоянно стремились записывать и хранить информацию. В этой главе мы опишем, как последнее крупное достижение человечества в области хранения данных — цифровые вычисления — представляет информацию. Мы также покажем, как интерпретировать смысл цифровых данных.

Современные компьютеры используют различные носители для хранения информации (например, магнитные диски, оптические диски, флэш-память, ленты и простые электрические схемы). Мы охарактеризуем запоминающие устройства позже в главе 11; однако для данного обсуждения носитель в значительной степени не имеет значения — будь то лазер, сканирующий поверхность DVD, или головка диска, скользящая по магнитному диску, вывод устройства хранения в конечном счете представляет собой последовательность электрических сигналов. Для упрощения схемы каждый сигнал является двоичным, то есть он может принимать только одно из двух состояний: отсутствие напряжения (интерпретируется как ноль) и наличие напряжения (единица). В этой главе рассматривается, как системы кодируют информацию в двоичные файлы независимо от исходного носителя данных.

В двоичном формате каждый сигнал соответствует одному биту (двоичной цифре) информации: нулю или единице. Может показаться удивительным, что все данные могут быть представлены только нулями и единицами. Конечно, по мере увеличения сложности информации увеличивается и количество битов, необходимых для ее представления. К счастью, количество уникальных значений удваивается для каждого дополнительного бита в битовой последовательности, поэтому последовательность из N битов может представлять 2 N уникальных значений.

Рисунок 1 иллюстрирует рост количества представляемых значений по мере увеличения длины битовой последовательности. Один бит может представлять два значения: 0 и 1. Два бита могут представлять четыре значения: оба однобитовых значения с начальным 0 (00 и 01), и оба однобитовых значения с ведущей 1 (10 и 11). Тот же шаблон применяется для любого дополнительного бита, который расширяет существующую битовую последовательность: новый бит может быть 0 или 1, и в любом случае оставшиеся биты представляют тот же диапазон значений, что и до добавления нового бита. Таким образом, добавление дополнительных битов экспоненциально увеличивает количество значений, которые может представлять новая последовательность.

Рисунок 1. Значения, которые могут быть представлены одним-четырьмя битами. Подчеркнутые биты соответствуют префиксу из строки выше.

Поскольку один бит не представляет большого объема информации, системы хранения обычно группируют биты в более длинные последовательности для хранения более интересных значений. Самая распространенная группа — это байт, представляющий собой набор из восьми битов. Один байт представляет 2 8 = 256 уникальных значений (0-255) — достаточно, чтобы перечислить буквы и распространенные знаки пунктуации английского языка. Байты – это наименьшая единица адресуемой памяти в компьютерной системе. Это означает, что программа не может запрашивать менее восьми битов для хранения переменной.

Современные процессоры также обычно определяют слово как 32-битное или 64-битное, в зависимости от конструкции оборудования. Размер слова определяет размер «по умолчанию», который аппаратное обеспечение системы использует для перемещения данных от одного компонента к другому (например, между памятью и регистрами). Эти более крупные последовательности необходимы для хранения чисел, поскольку программам часто приходится считать больше 256!

Если вы программировали на C, вы знаете, что перед использованием необходимо объявить переменную. Такие объявления информируют компилятор C о двух важных свойствах, касающихся двоичного представления переменной: количестве битов, выделяемых для нее, и способе, которым программа намерена интерпретировать эти биты. Концептуально количество битов является простым, поскольку компилятор просто ищет, сколько битов связано с объявленным типом (например, char — это один байт) и связывает этот объем памяти с переменной. Интерпретация последовательности битов гораздо более интересна с концептуальной точки зрения. Все данные в памяти компьютера хранятся в виде битов, но биты не имеют внутреннего значения. Например, даже имея всего один бит, вы можете интерпретировать два значения этого бита по-разному: вверх и вниз, черно-белое, да и нет, вкл и выкл и т. д.

Увеличение длины битовой последовательности расширяет диапазон ее интерпретаций. Например, переменная char использует стандарт кодирования American Standard Code for Information Interchange (ASCII), который определяет, как восьмибитное двоичное значение соответствует английским буквам и знакам пунктуации. В таблице 1 показана небольшая часть стандарта ASCII (для полного ознакомления запустите man ascii в командной строке).Нет особой причины, по которой символ «X» должен соответствовать 01011000, так что не утруждайте себя заучиванием таблицы. Важно то, что каждая программа, сохраняющая буквы, соглашается с интерпретацией их битовой последовательности, поэтому ASCII определяется комитетом по стандартам.


Компьютеры используют двоичный код — цифры 0 и 1 — для хранения данных. Двоичная цифра или бит — это наименьшая единица данных в вычислениях. Он представлен 0 или 1. Двоичные числа состоят из двоичных цифр (битов), например, двоичное число 1001. Схемы процессора компьютера состоят из миллиардов транзисторов. Транзистор — это крошечный переключатель, который активируется электронными сигналами, которые он получает. Цифры 1 и 0, используемые в двоичном формате, отражают состояния включения и выключения транзистора. Компьютерные программы представляют собой наборы инструкций. Каждая инструкция переводится в машинный код — простые двоичные коды, которые активируют ЦП. Программисты пишут компьютерный код, который преобразуется транслятором в двоичные инструкции, которые может выполнять процессор. Все программное обеспечение, музыка, документы и любая другая информация, которая обрабатывается компьютером, также хранится в двоичном формате. [1]

Чтобы включить строки, целые числа, символы и цвета. Это должно включать в себя рассмотрение пространства, занимаемого данными, например соотношение между шестнадцатеричным представлением цветов и количеством доступных цветов.

Содержание

Как файл хранится на компьютере [ изменить ]

Как изображение хранится в компьютере [ изменить ]


Изображение представляет собой матрицу значений пикселей. По сути, каждое изображение можно представить в виде матрицы значений пикселей [2]

Способ представления данных в компьютере. [править]

Чтобы включить строки, целые числа, символы и цвета. Это должно включать в себя рассмотрение пространства, занимаемого данными, например соотношение между шестнадцатеричным представлением цветов и количеством доступных цветов [3] .

Юникод — это стандартизация присвоения значений определенному символу. Это необходимо, поскольку в разных языках существуют сотни разных символов, и если это будет сделано каждым сообществом, то, скорее всего, возникнут совпадения.

Этот полезный материал с благодарностью использован на вики-сайте по компьютерным наукам в соответствии с лицензией Creative Commons Attribution 3.0 [4]

Этот контент был заархивирован и больше не поддерживается Университетом Индианы. Информация здесь может быть неточной, а ссылки могут быть недоступны или ненадежны.

Примечание. Следующая информация частично предоставлена ​​проектом Extreme Science and Engineering Discovery Environment ( XSEDE ) Национального научного фонда (NSF), который предоставляет исследователям передовые цифровые ресурсы и услуги, облегчающие научные открытия. Дополнительную информацию см. на веб-сайте XSEDE.

Бит — это двоичная цифра, наименьший приращение данных на компьютере. Бит может содержать только одно из двух значений: 0 или 1, что соответствует электрическим значениям выключено или включено соответственно.

Поскольку биты очень малы, вы редко работаете с информацией по одному биту за раз. Биты обычно собираются в группу из восьми, чтобы сформировать байт. Байт содержит достаточно информации для хранения одного символа ASCII, например "h".

Килобайт (КБ) — это 1 024 байта, а не тысяча байтов, как можно было бы ожидать, потому что компьютеры используют двоичную систему (с основанием два) вместо десятичной (с основанием десять).

Хранилище и память компьютера часто измеряются в мегабайтах (МБ) и гигабайтах (ГБ). Роман среднего размера содержит около 1 МБ информации. 1 МБ – это 1 024 килобайта, или 1 048 576 (1024 x 1024) байт, а не миллион байт.

Точно так же один 1 ГБ равен 1024 МБ или 1 073 741 824 (1024 x 1024 x 1024) байт. Терабайт (ТБ) равен 1024 ГБ; 1 ТБ — это примерно такой же объем информации, как и все книги в большой библиотеке, или примерно 1610 компакт-дисков с данными. Петабайт (ПБ) равен 1024 ТБ. 1 ПБ данных, записанных на DVD, создаст примерно 223 100 DVD, т. е. стопку высотой около 878 футов или стопку компакт-дисков высотой в милю. Университет Индианы в настоящее время создает системы хранения, способные хранить петабайты данных. Эксабайт (ЭБ) равен 1024 ПБ. Зеттабайт (ZB) равен 1024 ЭБ. Наконец, йоттабайт (YB) равен 1024 ZB.

Многие производители жестких дисков используют десятичную систему счисления для определения объема дискового пространства. В результате 1 МБ определяется как один миллион байтов, 1 ГБ определяется как один миллиард байтов и так далее. Поскольку ваш компьютер использует двоичную систему, как указано выше, вы можете заметить несоответствие между опубликованной емкостью вашего жесткого диска и емкостью, подтвержденной вашим компьютером. Например, жесткий диск, который, как говорят, содержит 10 ГБ дискового пространства с использованием десятичной системы счисления, на самом деле способен хранить 10 000 000 000 байтов.Однако в двоичной системе 10 ГБ составляют 10 737 418 240 байт. В результате вместо подтверждения 10 ГБ ваш компьютер подтвердит 9,31 ГБ. Это не неисправность, а вопрос разных определений.

Мы считаем по основанию 10 по степеням 10:

Компьютеры считают по основанию 2:

Итак, на компьютерном жаргоне используются следующие единицы:

< /th> < td>1 048 576 байт

Примечание. Названия и сокращения для количества байтов легко спутать с обозначениями для битов. В сокращениях для количества битов используется строчная буква «b» вместо прописной «B». Поскольку один байт состоит из восьми битов, эта разница может быть значительной. Например, если рекламируется широкополосное подключение к Интернету со скоростью загрузки 3,0 Мбит/с, его скорость составляет 3,0 мегабита в секунду или 0,375 мегабайта в секунду (сокращенно 0,375 Мбит/с). Биты и скорости передачи данных (биты во времени, например, в битах в секунду [бит/с]) чаще всего используются для описания скорости соединения, поэтому уделяйте особое внимание при сравнении поставщиков и услуг подключения к Интернету.

Этот документ был разработан при поддержке грантов Национального научного фонда (NSF) 1053575 и 1548562. Любые мнения, выводы, выводы или рекомендации, выраженные в этом материале, принадлежат авторам и не обязательно отражают точку зрения НФС.

Несмотря на то, что были приложены все усилия для соблюдения правил стиля цитирования, могут быть некоторые расхождения. Если у вас есть какие-либо вопросы, обратитесь к соответствующему руководству по стилю или другим источникам.

Наши редакторы рассмотрят то, что вы отправили, и решат, нужно ли пересматривать статью.

память компьютера, устройство, используемое для хранения данных или программ (последовательностей инструкций) на временной или постоянной основе для использования в электронном цифровом компьютере. Компьютеры представляют информацию в двоичном коде, записанном в виде последовательностей нулей и единиц. Каждая двоичная цифра (или «бит») может быть сохранена любой физической системой, которая может находиться в одном из двух стабильных состояний, представляющих 0 и 1. Такая система называется бистабильной. Это может быть выключатель, электрический конденсатор, который может накапливать или терять заряд, магнит с полярностью вверх или вниз или поверхность, на которой может быть ямка или нет. Сегодня конденсаторы и транзисторы, работающие как крошечные электрические переключатели, используются для временного хранения, а для долговременного хранения используются либо диски, либо ленты с магнитным покрытием, либо пластиковые диски с узором из ямок.

Память компьютера делится на основную (или первичную) память и вспомогательную (или вторичную) память. Основная память содержит инструкции и данные во время выполнения программы, а вспомогательная память содержит данные и программы, которые в данный момент не используются, и обеспечивает долгосрочное хранение.

Виртуальная реальность используется только в игрушках? Использовались ли когда-нибудь роботы в бою? От компьютерных клавиатур до флэш-памяти — узнайте о гаджетах и ​​технологиях с помощью этой викторины.

Основная память

Самыми ранними запоминающими устройствами были электромеханические переключатели или реле (см. компьютеры: первый компьютер) и электронные лампы (см. компьютеры: первая хранимая программа). машины). В конце 1940-х годов первые компьютеры с хранимой программой использовали в качестве основной памяти ультразвуковые волны в ртутных трубках или заряды в специальных электронных лампах. Последние были первой оперативной памятью (ОЗУ). ОЗУ содержит ячейки памяти, к которым можно получить прямой доступ для операций чтения и записи, в отличие от памяти с последовательным доступом, такой как магнитная лента, в которой необходимо последовательно обращаться к каждой ячейке, пока не будет найдена требуемая ячейка.

Магнитная память барабана

Магнитные барабаны с фиксированными головками чтения/записи для каждой из множества дорожек на внешней поверхности вращающегося цилиндра, покрытого ферромагнитным материалом, использовались как для основной, так и для вспомогательной памяти в 1950-х годах, хотя доступ к данным у них был последовательным. .

Память на магнитном сердечнике

Примерно в 1952 году была разработана первая относительно дешевая оперативная память: память на магнитных сердечниках, расположение крошечных ферритовых сердечников на проволочной сетке, через которую можно было направлять ток для изменения выравнивания отдельных сердечников.Из-за неотъемлемых преимуществ оперативной памяти основная память была основной формой основной памяти, пока в конце 1960-х годов ее не вытеснила полупроводниковая память.

Полупроводниковая память

Существует два основных типа полупроводниковой памяти. Статическая RAM (SRAM) состоит из триггеров, бистабильной схемы, состоящей из четырех-шести транзисторов. Как только триггер сохраняет бит, он сохраняет это значение до тех пор, пока в нем не будет сохранено противоположное значение. SRAM обеспечивает быстрый доступ к данным, но физически она относительно велика. Он используется в основном для небольших объемов памяти, называемых регистрами, в центральном процессоре компьютера (ЦП) и для быстрой «кэш-памяти». Динамическое ОЗУ (DRAM) хранит каждый бит в электрическом конденсаторе, а не в триггере, используя транзистор в качестве переключателя для зарядки или разрядки конденсатора. Поскольку в нем меньше электрических компонентов, ячейка памяти DRAM меньше, чем SRAM. Однако доступ к его значению происходит медленнее, и, поскольку конденсаторы постепенно теряют заряд, хранящиеся значения необходимо перезаряжать примерно 50 раз в секунду. Тем не менее, DRAM обычно используется для основной памяти, потому что чип того же размера может вместить в несколько раз больше DRAM, чем SRAM.

Ячейки памяти в оперативной памяти имеют адреса. Обычно оперативную память организуют в «слова» от 8 до 64 бит или от 1 до 8 байт (8 бит = 1 байт). Размер слова обычно представляет собой количество битов, которые могут быть переданы за один раз между основной памятью и ЦП. Каждое слово и обычно каждый байт имеют адрес. Микросхема памяти должна иметь дополнительные схемы декодирования, которые выбирают набор ячеек хранения, находящихся по определенному адресу, и либо сохраняют значение по этому адресу, либо извлекают то, что там хранится. Основная память современного компьютера состоит из нескольких микросхем памяти, каждая из которых может содержать много мегабайт (миллионов байтов), а схема адресации выбирает соответствующую микросхему для каждого адреса. Кроме того, DRAM требует, чтобы схемы обнаруживали сохраненные значения и периодически обновляли их.

Для доступа к данным основной памяти требуется больше времени, чем процессору для работы с ними. Например, доступ к памяти DRAM обычно занимает от 20 до 80 наносекунд (миллиардных долей секунды), но арифметические операции ЦП могут занимать всего наносекунду или меньше. Есть несколько способов справиться с этим несоответствием. ЦП имеют небольшое количество регистров, очень быструю SRAM, в которой хранятся текущие инструкции и данные, с которыми они работают. Кэш-память — это больший объем (до нескольких мегабайт) быстрой SRAM на кристалле ЦП. Данные и инструкции из основной памяти передаются в кэш-память, а поскольку программы часто демонстрируют «локальность ссылок», то есть они некоторое время выполняют одну и ту же последовательность инструкций в повторяющемся цикле и оперируют наборами связанных данных, ссылки на память могут помещаться в быстрый кэш после того, как в него будут скопированы значения из основной памяти.

Большая часть времени доступа к DRAM уходит на декодирование адреса для выбора соответствующих ячеек памяти. Свойство локальности ссылки означает, что последовательность адресов памяти будет часто использоваться, а быстрая DRAM предназначена для ускорения доступа к последующим адресам после первого. Синхронная DRAM (SDRAM) и EDO (расширенный вывод данных) — два таких типа быстрой памяти.

Энергонезависимая полупроводниковая память, в отличие от SRAM и DRAM, не теряет своего содержимого при отключении питания. Некоторые энергонезависимые запоминающие устройства, такие как постоянное запоминающее устройство (ПЗУ), нельзя перезаписывать после изготовления или записи. Каждая ячейка памяти микросхемы ПЗУ имеет либо транзистор для 1 бита, либо ни одного для 0 бита. ПЗУ используются для программ, которые являются неотъемлемой частью работы компьютера, таких как программа начальной загрузки, которая запускает компьютер и загружает его операционную систему, или BIOS (базовая система ввода-вывода), которая обращается к внешним устройствам в персональном компьютере (ПК).

EPROM (стираемое программируемое ПЗУ), EAROM (электрически изменяемое ПЗУ) и флэш-память — это типы энергонезависимой памяти, которые можно перезаписывать, хотя перезапись занимает гораздо больше времени, чем чтение. Таким образом, они используются в качестве памяти специального назначения, когда запись требуется редко — если они используются, например, для BIOS, их можно изменить для исправления ошибок или обновления функций.

В оптических устройствах наличие света интерпретируется как "1", а его отсутствие интерпретируется как "0". Оптические устройства используют эту технологию для чтения или хранения данных. Возьмем, к примеру, компакт-диск: если блестящую поверхность поместить под мощный микроскоп, на поверхности будут видны очень маленькие отверстия, называемые ямками. Участки, на которых нет ям, называются землей.

  • Разработка устройств, способных напрямую понимать естественный язык, оказалась сложной задачей из-за сложности естественных языков. Однако проще построить электрические цепи на основе двоичной логики или логики включения и выключения. Все формы данных могут быть представлены в формате двоичной системы.Другие причины использования двоичного кода заключаются в том, что цифровые устройства более надежны, компактны и потребляют меньше энергии по сравнению с аналоговыми устройствами.

Биты, байты, полубайты и слова

  • Термины биты, байты, полубайты и слова широко используются в отношении памяти компьютера и размера данных.
  • Биты: можно определить как двоичное число, которое может быть равно 0 или 1. Это основная единица данных или информации в цифровых компьютерах.
  • Байт: группа битов (8 бит), используемая для представления символа. Байт считается основной единицей измерения объема памяти в компьютере.
  • Полбайт: это половина байта, которая обычно представляет собой группу из 4 байтов.
  • Слово: два или более бита составляют слово. Термин длина слова используется как мера количества битов в каждом слове. Например, слово может иметь длину 16 бит, 32 бита, 64 бита и т. д.
  • Компьютеры обрабатывают не только числа, буквы и специальные символы, но и сложные типы данных, такие как звук и изображения. Однако эти сложные типы данных занимают много памяти и процессорного времени при кодировании в двоичной форме.
  • Это ограничение требует разработки более эффективных способов обработки длинных потоков двоичных цифр.
  • Большие системы счисления используются в вычислениях, чтобы преобразовать эти потоки двоичных цифр в управляемую форму. Это помогает повысить скорость обработки и оптимизировать использование памяти.

Системы счисления и их представление

  • Система счисления – это набор символов, используемых для представления значений, полученных из общего основания или системы счисления.
  • Что касается компьютеров, системы счисления можно разделить на две основные категории:
  • десятичная система счисления
  • двоичная система счисления
  • восьмеричная система счисления
  • шестнадцатеричная система счисления

Десятичная система счисления

  • Термин "десятичный" происходит от латинского префикса deci, что означает "десять". Десятичная система счисления состоит из десяти цифр от 0 до 9. Потому что в этой системе десять цифр; ее также называют десятичной системой счисления или десятичной системой счисления.
  • Десятичное число всегда должно быть записано с индексом 10, например. Х10
  • Но поскольку это наиболее широко используемая система счисления в мире, в письменной работе нижний индекс обычно понимается и игнорируется. Однако, когда многие системы счисления рассматриваются вместе, нижний индекс всегда должен ставиться так, чтобы различать системы счисления.
  • С помощью этих параметров можно определить величину числа.
  • Абсолютное значение
  • Значение места или позиционное значение
  • Базовое значение
    • Абсолютное значение – это величина цифры в числе. например, цифра 5 в числе 7458 имеет абсолютное значение 5 в соответствии со своим значением в числовой строке.
    • Местное значение цифры в числе относится к положению цифры в этом числе, т. е. является ли; десятки, сотни, тысячи и т. д.
    • Общее значение числа – это сумма разрядов каждой цифры, составляющей число.
    • Основное значение числа, также называемое системой счисления k, зависит от типа используемой системы счисления. Значение любого числа зависит от системы счисления. например, число 10010 не эквивалентно 1002.

    Для представления чисел используются две цифры, а именно 1 и 0. в отличие от десятичных чисел, где разрядное значение увеличивается в десять раз, в двоичной системе разрядное значение увеличивается в 2 раза. двоичные числа записываются как X2. рассмотрим двоичное число, такое как 10112. Самая правая цифра имеет разрядное значение 1×2 0 , а самая левая — разрядное значение 1×2 3 .

    Восьмеричная система счисления

    Состоит из восьми цифр от 0 до 7. Разрядность восьмеричных чисел увеличивается в восемь раз справа налево.

    Шестнадцатеричная система счисления
    Это система счисления с основанием 16, состоящая из шестнадцати цифр от 0 до 9 и букв AF, где A эквивалентно 10, B до 11 до F, что эквивалентно 15 по основанию. десятая система. Разрядное значение шестнадцатеричных чисел увеличивается в шестнадцать раз.

    • Шестнадцатеричное число можно обозначить с помощью 16 в качестве нижнего индекса или заглавной буквы H справа от числа. Например, 94B можно записать как 94B16 или 94BH.

    Дальнейшее преобразование чисел из одной системы счисления в другую

    Читайте также:

Единица Эквивалент
1 килобайт (КБ) 1024 байта
1 мегабайт (МБ)
1 гигабайт (ГБ) 1 073 741 824 байта
1 терабайт (ТБ) ) 1 099 511 627 776 байт
1 петабайт (ПБ) 1 125 899 906 842 624 байт