Перечислите типы информации по форме ее компьютерного представления
Обновлено: 21.11.2024
только два состояния. Оказывается, этого достаточно, чтобы вся идея заработала. Фактически любая система, которая может представлять по крайней мере два состояния, может представлять информацию. Возьмем, к примеру, азбуку Морзе, используемую в телеграфии. Морзе — это система передачи звука, которая может передавать короткий звуковой сигнал (обозначается точкой) и длинный звуковой сигнал (обозначается тире). Любая буква или цифра может быть представлена комбинацией этих двух символов. Нажмите здесь, чтобы увидеть переводчик Морзе.
Аналогично с компьютерами. Для представления числа мы используем двоичную арифметическую систему, а не десятичную систему счисления, которую используем в повседневной жизни. В двоичной системе любое число может быть представлено с использованием только двух символов, 0 и 1. (Морзе является почти, но не совсем (из-за пауз между буквами) двоичной системой. Система, тесно связанная с Морзе, используется компьютерами для сделать сжатие данных (подробнее об этом позже). Вот как двоичные числа соответствуют нашим десятичным числам:
И так далее. Обе системы позиционные: отличная идея, которой мы обязаны арабским математикам, потому что до них считать по-римски было тяжело (DCCCLXXXII + CXVIII = M, знаете ли. ), а считать по-гречески было почти невозможно (omega pi beta + rho iota eta = альфа).
Позиционное означает, что положение каждого символа в числе определяет его значение. Таким образом, 32 отличается от 23, потому что 3 и 2 находятся в разных позициях, и каждая позиция имеет местное значение. Вы это уже знаете, но делаете это инстинктивно, и мы напоминаем вам об этом, потому что будем делать то же самое с двоичными числами.
Например, вы знаете, что значение числа 1492:
1492 = 1*1000 + 4*100 + 9*10 + 2*1 = 1*10 3 + 4*10 2 + 9*10 1 + 2*1 0
Таким образом, значение каждой цифры определяется степенью 10 в этой позиции.
Точно так же число 1101 в двоичном формате означает 13, потому что
13 = 1*8 + 1*4 + 0*2 + 1*1 = 1*2 3 + 1*2 2 + 0*2 1 + 1*2 0
Числа 8, 4, 2, 1, как вы знаете, являются степенями двойки, начиная справа и двигаясь влево: 1 = 2 0 , 2 = 2 1 , 4 = 2 1 и 8 = 2 3
Десятичная система также называется "по основанию 10", а двоичная - "по основанию 2", потому что каждая цифра в числе составляет целое в зависимости от степени 10 (или степени 2), на которую она умножается.< /p>
Конечно, у нас могут быть позиционные системы по разным основаниям, например по основанию 12 (или "дюжина") и по основанию 7 (неделя). Очень скоро в этом курсе мы будем работать с основанием шестнадцать.
Что такого замечательного в позиционной системе? Арифметические вычисления намного проще, чем в непозиционных системах. Представляете, каким был бы второй класс, если бы вам пришлось вычислять, что XLVIII + LXVII = CXV? Упражнение на двоичном формате
Важно хорошо ориентироваться в двоичной системе счисления. Попробуйте посчитать вручную следующие разговоры, а затем проверьте результаты, нажав на пустые ячейки:
Десятичный | Двоичный |
---|
Основные отношения
Одной из ключевых тем этого курса является представление. Компьютеры представляют множество интересных вещей, таких как цвета, изображения, музыка, видео, а также обыденные вещи, такие как числа и текст, или даже сложные вещи, такие как программы. В конце концов, вы знаете, что на самом низком уровне всех этих представлений есть биты.
Одним из важных аспектов этих двоичных представлений является взаимосвязь между количеством битов и мощностью представления. Чем больше у нас битов, тем больше вещей мы можем представить.
Давайте будем конкретны всего на минуту. Вы видели выше, что с помощью одного бита вы можете пронумеровать две вещи: одну, помеченную как «ноль», и одну, помеченную как «единица», потому что есть два возможных шаблона: . С двумя битами вы можете пронумеровать четыре вещи, потому что есть четыре возможных шаблона: <00, 01, 10, 11>. С тремя битами вы можете пронумеровать восемь вещей. (Вы можете перечислить восемь шаблонов? Возьмите четыре шаблона из двух битов и запишите их дважды, один раз как 0xy и еще раз как 1xy .) Таким образом, всякий раз, когда мы используем дополнительный бит, мы получаем в два раза больше шаблонов.
Вот таблица взаимосвязи между количеством битов и количеством шаблонов:
Количество битов | Количество шаблонов |
---|---|
1 | 2 |
2 | 4 |
3 | 8 |
4 | 16 |
5 | 32 |
6 | 64 |
7 | 128 |
8 | 256 |
. | |
16 | ≈ 65 000 |
. | |
24 td> | ≈ 16 миллионов |
. | |
32 | ≈ 4 миллиарда |
. | < /tr>|
Н | 2 Н |
Эта фундаментальная взаимосвязь важна и нелогична, поскольку она экспоненциальна. Последняя строка таблицы показывает нам, что N битов дают 2 N шаблонов. Это неинтуитивно, потому что, если вы удвоите количество битов, вы не получите двойное количество шаблонов, вы получите квадрат. Например, удвоив 3 бита (8 шаблонов) до 6 бит, вы получите 64 шаблона.
Мы увидим, что эта взаимосвязь возникает, например, при обсуждении индексированного цвета, потому что ограничения, которые мы накладываем на количество битов в представлении, приводят к ограничению количества цветов. Это ключевая идея.
Текстовое представление
Текст представлен так называемым кодом ASCII. Много лет назад производители первых компьютеров решили представлять каждый возможный символ (видимый или невидимый, например, пробел или новую строку) числом. Результатом был (частично) код, который вы видите ниже.
Часть таблицы набора символов ASCII. Чтобы найти код определенного символа в таблице, прибавьте номер строки слева (32, 48 и т. д.) к номеру столбца сверху. Так, например, заглавная буква А представлена десятичным числом 64 + 1 или 65.
Более полная таблица ASCII приведена ниже, которая включает управляющие символы с соответствующими графическими символами, а также для каждого символа его шестнадцатеричный, десятичный и двоичный коды: Таблица набора символов ASCII. Нажмите, чтобы увеличить изображение. Чтобы найти код определенного символа в таблице, прибавьте номер строки слева (32, 48 и т. д.) к номеру столбца сверху. Так, например, А представляется десятичным числом 65 (т. е. 64 + 1) или двоичным числом 01000001. Приветствие «Привет!» представлен последовательностью 72 105 33 или в двоичном виде 010010000110100100100001. Конечно, необходимо проявлять некоторую осторожность, чтобы распознавать, когда мы смотрим на число и когда мы смотрим на строку символов. Но это не сложно.-->
Например, буква E имеет код ASCII 69 и двоичное представление 01000100. 8 бит изображены группами по четыре, потому что четыре бита используются для представления одной цифры в шестнадцатеричной системе, которую мы обсудим. позже.
Первые две строки таблицы представляют собой так называемые управляющие символы, символы, которые не видны, такие как backspace (BS), escape (ESC), CR (возврат каретки — старое слово). для ввода) и т. д. Если вас интересуют все аббревиатуры, веб-сайт AsciiTable объясняет их подробно.
Управляющие символы
Вы заметите, что первая таблица выше начинается с кода ASCII 32, который соответствует символу пробела. (Да, даже символ пробела должен быть представлен.) Фактическая система ASCII начинается с 0, но первые 32 символа являются «управляющими» символами, потому что они изначально использовались для управления ранними принтерами. Например, символ TAB — это код ASCII 9, символ перевода строки (который перемещал бумагу вверх) — код ASCII 10, а символ возврата каретки (который перемещал печатающую головку назад к левому краю бумаги) — код ASCII 13. . Поскольку эти символы не представляют интереса в контексте данного класса, мы исключили их из таблицы.
Концы строк
Если бы нам нужно было беспокоиться только о символах, текстовое представление было бы довольно простым. Однако текст организован в строки, и по историческим причинам одно из тонких различий между Windows, Mac и Unix/Linux заключается в том, как представляются окончания строк. В старые времена, до появления Windows, Mac и Unix, первые телетайпные принтеры использовали два управляющих символа в конце каждой строки: символ возврата каретки для перемещения печатающей головки влево и символ перевода строки для перемещения бумаги вверх на одна строка.
Макинтош представляет конец строки символом возврата каретки. Linux использует символ перевода строки. Windows использует оба, как и в старые времена.
Обычно, когда вы передаете текстовый файл из одной системы в другую, программа FTP (Fetch, WinSCP или какая-либо другая) заменяет соответствующее окончание строки. «Текстовый режим» передачи говорит сделать эти замены; «двоичный режим» не делает никаких замен и больше подходит для нетекстовых файлов, таких как изображения или программы. Обратите внимание, что HTML и CSS — это оба вида текста. В большинстве FTP-программ есть настройка «угадай, какой режим», которая обычно работает довольно хорошо, но иногда может допускать ошибку, поэтому иногда полезно знать этот малоизвестный факт. По этой же причине часто не удается выполнить копирование/вставку между Mac и Windows.
Юникод
В ранней системе ASCII было место для 256 символов, чего было достаточно для представления всех английских символов, знаков препинания, цифр и т. д.Оказывается, на Земле есть и другие языки, помимо английского (;-), и последнее программное обеспечение пишется для их поддержки с помощью гораздо более крупного кода, называемого Unicode. Мы уже использовали юникод при размещении этого тега в нашем HTML:
В вашей книге Head First HTML & CSS о Unicode рассказывается на странице 239.
Если вы научились представлять числа и символы, вы также можете представлять инструкции . Именно это наблюдение привело фон Неймана и его сотрудников к созданию универсального перепрограммируемого компьютера. Опять же, нужно следить за тем, когда вы смотрите на инструкции, а не на строку символов.
В будущем мы узнаем, как компьютер представляет изображения, звук и фильмы. -->
Биты и байты
- Килобайты (КБ) или 1000 байт. Около четверти страницы текста.
- Мегабайты (МБ) или 1000 килобайт. Около 250 книжек текста.
- Гигабайты (ГБ), что составляет 1000 МБ. О количестве текста в небольшой библиотеке.
Примечание о стандартных сокращениях
- Прописная буква B используется для байтов, а строчная буква b используется для битов. Сетевые скорости, когда биты передаются по проводу один за другим, обычно измеряются в битах в секунду или битах в секунду. Размер файла всегда указывается в байтах, следовательно, в килобайтах или мегабайтах.
- Сокращение для kilo – это буква k в нижнем регистре, следовательно, kB означает килобайты. Сокращения для других префиксов ( mega , giga , tera , peta . ) все в верхнем регистре: M, G, T, P .
Исторически ученые-компьютерщики часто использовали килобайты для обозначения 1024 байтов, потому что 1024 довольно близко к 1000, а байты часто представляют собой куски, размер которых равен степени 2, а 1024=2 10 . Например, если вы купите флешку на 4 ГБ, она будет вмещать не ровно 4 миллиарда байт, а немного больше из-за этой разницы. Жесткие диски и скорость сети, с другой стороны, обычно измеряются в степени 10, а не в степени двойки. На практике это редко имеет значение.
Компьютеры в наши дни поставляются с огромным объемом памяти на жестком диске (часто сотни ГБ), но обычно они могут обрабатывать только несколько ГБ из них за раз (их основная память или ОЗУ). Мы будем часто использовать эти символы в будущих лекциях.
только два состояния. Оказывается, этого достаточно, чтобы вся идея заработала. Фактически любая система, которая может представлять по крайней мере два состояния, может представлять информацию. Возьмем, к примеру, азбуку Морзе, используемую в телеграфии. Морзе — это система передачи звука, которая может передавать короткий звуковой сигнал (обозначается точкой) и длинный звуковой сигнал (обозначается тире). Любая буква или цифра может быть представлена комбинацией этих двух символов. Нажмите здесь, чтобы увидеть переводчик Морзе.
Аналогично с компьютерами. Для представления числа мы используем двоичную арифметическую систему, а не десятичную систему счисления, которую используем в повседневной жизни. В двоичной системе любое число может быть представлено с использованием только двух символов, 0 и 1. (Морзе является почти, но не совсем (из-за пауз между буквами) двоичной системой. Система, тесно связанная с Морзе, используется компьютерами для сделать сжатие данных (подробнее об этом позже). Вот как двоичные числа соответствуют нашим десятичным числам:
И так далее. Обе системы позиционные: отличная идея, которой мы обязаны арабским математикам, потому что до них считать по-римски было тяжело (DCCCLXXXII + CXVIII = M, знаете ли. ), а считать по-гречески было почти невозможно (omega pi beta + rho iota eta = альфа).
Позиционное означает, что положение каждого символа в числе определяет его значение. Таким образом, 32 отличается от 23, потому что 3 и 2 находятся в разных позициях, и каждая позиция имеет местное значение. Вы это уже знаете, но делаете это инстинктивно, и мы напоминаем вам об этом, потому что будем делать то же самое с двоичными числами.
Например, вы знаете, что значение числа 1492:
1492 = 1*1000 + 4*100 + 9*10 + 2*1 = 1*10 3 + 4*10 2 + 9*10 1 + 2*1 0
Таким образом, значение каждой цифры определяется степенью 10 в этой позиции.
Точно так же число 1101 в двоичном формате означает 13, потому что
13 = 1*8 + 1*4 + 0*2 + 1*1 = 1*2 3 + 1*2 2 + 0*2 1 + 1*2 0
Числа 8, 4, 2, 1, как вы знаете, являются степенями двойки, начиная справа и двигаясь влево: 1 = 2 0 , 2 = 2 1 , 4 = 2 1 и 8 = 2 3
Десятичная система также называется "по основанию 10", а двоичная - "по основанию 2", потому что каждая цифра в числе составляет целое в зависимости от степени 10 (или степени 2), на которую она умножается.< /p>
Конечно, у нас могут быть позиционные системы по разным основаниям, например по основанию 12 (или "дюжина") и по основанию 7 (неделя). Очень скоро в этом курсе мы будем работать с основанием шестнадцать.
Что такого замечательного в позиционной системе?Арифметические вычисления намного проще, чем в непозиционных системах. Представляете, каким был бы второй класс, если бы вам пришлось вычислять, что XLVIII + LXVII = CXV? Упражнение на двоичном формате
Важно хорошо ориентироваться в двоичной системе счисления. Попробуйте посчитать вручную следующие разговоры, а затем проверьте результаты, нажав на пустые ячейки:
Десятичный | Двоичный |
---|
Основные отношения
Одной из ключевых тем этого курса является представление. Компьютеры представляют множество интересных вещей, таких как цвета, изображения, музыка, видео, а также обыденные вещи, такие как числа и текст, или даже сложные вещи, такие как программы. В конце концов, вы знаете, что на самом низком уровне всех этих представлений есть биты.
Одним из важных аспектов этих двоичных представлений является взаимосвязь между количеством битов и мощностью представления. Чем больше у нас битов, тем больше вещей мы можем представить.
Давайте будем конкретны всего на минуту. Вы видели выше, что с помощью одного бита вы можете пронумеровать две вещи: одну, помеченную как «ноль», и одну, помеченную как «единица», потому что есть два возможных шаблона: . С двумя битами вы можете пронумеровать четыре вещи, потому что есть четыре возможных шаблона: <00, 01, 10, 11>. С тремя битами вы можете пронумеровать восемь вещей. (Вы можете перечислить восемь шаблонов? Возьмите четыре шаблона из двух битов и запишите их дважды, один раз как 0xy и еще раз как 1xy .) Таким образом, всякий раз, когда мы используем дополнительный бит, мы получаем в два раза больше шаблонов.
Вот таблица взаимосвязи между количеством битов и количеством шаблонов:
Количество битов | Количество шаблонов | |
---|---|---|
1 | 2 | |
2 | 4 | |
3 | 8 | |
4 | 16 | |
5 | 32 | |
6 | 64 | |
7 | 128 | |
8 | 256 | |
. | ||
16 | ≈ 65 000 | |
. | ||
24 td> | ≈ 16 миллионов | |
. | ||
32 | ≈ 4 миллиарда | |
. | ||
N | 2 N |
Значение байта | Значение бита | |
---|---|---|
1 байт | 8 бит td> | |
1024 байта | 1 килобайт | |
1024 килобайта | 1 мегабайт td> | |
1024 мегабайта | 1 гигабайт | |
1024 гигабайта | 1 терабайт | td>|
1024 терабайта | 1 петабайт | |
1024 петабайта | 1 эксабайт td> | |
1024 эксабайта | 1 зеттабайт | |
1024 зеттабайта | 1 йоттабайт | td>|
1024 йоттабайта | 1 бронтобайт | |
1024 бронтобайта | 1 геобайт тд> |
Код ASCII | Десятичное значение | Символ | 0000 0000 | 0 | Нулевой запрос |
---|---|---|
0000 0001 | 1 td> | Начало заголовка |
0000 0010 | 2 | Начало текста |
0000 0011 | 3 | Конец текста |
0000 0100 | 4 | Конец передачи |
0000 0101 | 5 | Запрос |
0000 0110 | 6 | Подтверждение |
0000 0111 | 7 td> | Звуковой звонок |
0000 1000 | 8 | Backspace |
0000 1001 | 9 | Горизонтальная вкладка |
0000 1010 | 10 | Перевод строки |
Расширенный код ASCII
Расширенный табличный столбец ASCII
Юникод
Всемирный стандарт символов Unicode использует от 4 до 32 бит для представления букв, цифр и символов.
Читайте также:
- Как отключить интернет мегафон на планшете
- Ecc-память, что это такое
- Текстовый файл состоит не более чем из 10 6 символов. abc определяет максимальное количество
- Можно ли вернуть ноутбук в мвидео
- Где находится антивирус в Samsung