Сообщение длиной 28672 символа занимает в памяти 35 кбайт, найдите степень алфавита

Обновлено: 01.07.2024

Хотите улучшить этот вопрос? Добавьте подробности и уточните проблему, отредактировав этот пост.

Закрыт 10 месяцев назад.

Я пытаюсь выполнить динамическое программирование на основе количества символов в предложении. Какая буква английского алфавита занимает больше всего пикселей на экране?

Традиционная мудрость при наборе – M или W для прописных букв и m для строчных. Зависит от шрифта, но в большинстве случаев это приемлемо.

15 ответов 15

W выигрывает.

Конечно, это глупый эмпирический эксперимент. Однозначного ответа на вопрос, какая буква самая широкая, нет. Это зависит от шрифта. Поэтому вам придется провести аналогичный эмпирический эксперимент, чтобы выяснить ответ для вашей среды. Но дело в том, что большинство шрифтов следуют одним и тем же соглашениям, и заглавная буква W будет самой широкой.

Суть с этой шириной символов в форме соотношения (W = 100), полученной здесь, с использованием этого конкретного примера шрифта:

Интересно, что в «Arial Black» на моем MacBook в Chrome строчная буква m — самая широкая с небольшим отрывом.

Как насчет этого? WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ %%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% . поэтому я думаю, что победит @!!

В дополнение к удивительно практичному ответу Неда Бэтчелдера, потому что я пришел сюда, задаваясь вопросом о цифрах:

Я сомневался в этой информации, думая, что "1" наверняка будет более узкой, чем другие цифры. Но в шрифтах, которые я проверял, все цифры имеют одинаковую ширину. Я полагаю, это выбор дизайна шрифта.

По крайней мере, для меня (просматривая этот пост в Firefox в Ubuntu), 1 более узкий, чем другие, а остальные имеют одинаковую ширину.

@LukeTaylor -- Так оно и есть! семейство шрифтов: Arial, Helvetica Neue, Helvetica, без засечек; размер шрифта: 15px; Ох уж эта Apple, которая всегда пытается быть немного другой.

На самом деле это зависит от font-variant-numeric : пропорциональные числа допускают различную ширину как в глифе, так и в интервале, в то время как табличные числа должны подчиняться тем же правилам, что и моноширинные шрифты.

Как насчет программного решения?

Оба "M" и "W" имеют одинаковое количество пикселей. Поскольку в большинстве ответов говорится «W», лучше показать, что M и W одинаковы и выиграны. Кстати очень хороший ответ.

Заглавная буква "М" обычно самая широкая.

Я считаю, что буква W самая широкая.

Это также зависит от шрифта. Я сделал это 1 или 2 года назад с Processing и Helvetica, и это ILJTYFVCPAXUZKHSEDORGNBQMW в порядке увеличения пикселей. Идея состоит в том, чтобы нарисовать текст на холсте с помощью шрифта, на который вы смотрите, подсчитать пиксели, а затем отсортировать с помощью HashMap или Dictionary.

Конечно, это может не иметь прямого отношения к вашему использованию, так как вычисляет площадь в пикселях, а не только ширину. Может быть, это тоже немного перебор.

В зависимости от вашей платформы может быть способ "получитьWidth" из строки или функции DrawText() с помощью свойства ширины.

Я бы сделал простой алгоритм, который использует нужный шрифт, а затем просматривает алфавит и сохраняет его в небольшой конфигурации или просто вычисляет его при инициализации, поскольку цикл от А до Я не так уж и сложен.

Arial 30px в Chrome — W побеждает.

Решение для вычисления ширины шрифтов, немного похожее на решение, опубликованное xxx, было опубликовано Алексом Майклом в его блоге (который, как ни странно, связал меня здесь).

Обзор:

Код:

Я знаю, что здесь принятым ответом является W, W означает WIN.

Однако в данном случае W также означает ширину. В тематическом исследовании использовался простой тест ширины для проверки пикселей, но это была только ширина, а не общее количество пикселей. В качестве простого контрпримера: принятый ответ предполагает, что O и Q занимают одинаковое количество пикселей, но занимают одинаковое количество места.

Таким образом, W занимает больше всего пространства. Но неужели это все пиксели, которыми он задуман?

Давайте получим некоторые эмпирические данные. Я создал изображения imgur из следующих B, M и W. Затем я проанализировал их количество пикселей (см. ниже), вот результаты:

Вот как я загружал их в холст и анализировал необработанные пиксельные данные из изображений.

Хотите узнать настоящий самый длинный глиф, а не просто угадать?
И я говорю не только о буквах, цифрах и общеупотребительных символах (!, @ и так далее). Я имею в виду самый длинный глиф из всех 32 834 символов UTF-16.
Итак, я начал с ответа @NK, у которого было программное решение, и внес изменение:

После запуска и ожидания (и ожидания) выдается результат ௌ won .
И вот он, самый длинный символ в UTF-32! Обратите внимание, что в большинстве шрифтов самый длинный глиф — ﷽, но некоторые шрифты (особенно моноширинные) перекрывают символы, как в случае со шрифтом, с которым запускалась программа.

Исходный вопрос касается английского алфавита. Вы можете создать отдельный вопрос и ответить на свой вопрос.

Это будет зависеть от шрифта. Я бы написал небольшую программу на языке программирования, который вам наиболее удобен, где вы рисуете каждую букву алфавита в растровое изображение размера n, умноженное на m. Инициализируйте каждый пиксель белым цветом. Затем подсчитайте количество белых пикселей после того, как вы нарисовали каждую букву, и сохраните это число. Наибольшее число, которое вы найдете, — это то, что вы ищете.

РЕДАКТИРОВАТЬ: Если вас на самом деле просто интересует, какой из них занимает самый большой прямоугольник (но похоже, что вы действительно после этого, а не пиксели), вы можете использовать различные вызовы API, чтобы найти размер, но это зависит от вашего языка программирования. Например, в Java вы должны использовать класс FontMetrics.

Этот код получит ширину всех символов в виде массива:

Или, если вы хотите иметь карту ширины, содержащую больше, чем просто буквенные (цифровые) символы, как описано выше (как мне нужно в среде без браузера)

Это зависит от шрифта. Например, перечеркнутый ноль занимает значительно больше места, чем обычный.

Но если бы можно было предположить, я бы выбрал X или B.

Очень активный вопрос. Заработайте 10 репутации (не считая бонуса ассоциации), чтобы ответить на этот вопрос. Требование к репутации помогает защитить этот вопрос от спама и отсутствия ответа.

Не тот ответ, который вы ищете? Просмотрите другие вопросы с тегами css char или задайте свой вопрос.

Связано

Связанные

Горячие вопросы о сети

дизайн сайта / логотип © 2022 Stack Exchange Inc; вклады пользователей под лицензией cc by-sa. версия 2022.3.24.41762

Хотите улучшить этот вопрос? Добавьте подробности и уточните проблему, отредактировав этот пост.

Закрыт 10 месяцев назад.

Я пытаюсь выполнить динамическое программирование на основе количества символов в предложении. Какая буква английского алфавита занимает больше всего пикселей на экране?

Традиционная мудрость при наборе – M или W для прописных букв и m для строчных. Зависит от шрифта, но в большинстве случаев это приемлемо.

15 ответов 15

W выигрывает.

Конечно, это глупый эмпирический эксперимент. Однозначного ответа на вопрос, какая буква самая широкая, нет. Это зависит от шрифта. Поэтому вам придется провести аналогичный эмпирический эксперимент, чтобы выяснить ответ для вашей среды. Но дело в том, что большинство шрифтов следуют одним и тем же соглашениям, и заглавная буква W будет самой широкой.

Суть с этой шириной символов в форме соотношения (W = 100), полученной здесь, с использованием этого конкретного примера шрифта:

Интересно, что в «Arial Black» на моем MacBook в Chrome строчная буква m — самая широкая с небольшим отрывом.

Как насчет этого? WWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ %%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% . поэтому я думаю, что победит @!!

В дополнение к удивительно практичному ответу Неда Бэтчелдера, потому что я пришел сюда, задаваясь вопросом о цифрах:

Я сомневался в этой информации, думая, что "1" наверняка будет более узкой, чем другие цифры. Но в шрифтах, которые я проверял, все цифры имеют одинаковую ширину. Я полагаю, это выбор дизайна шрифта.

По крайней мере, для меня (просматривая этот пост в Firefox в Ubuntu), 1 более узкий, чем другие, а остальные имеют одинаковую ширину.

@LukeTaylor -- Так оно и есть! семейство шрифтов: Arial, Helvetica Neue, Helvetica, без засечек; размер шрифта: 15px; Ох уж эта Apple, которая всегда пытается быть немного другой.

На самом деле это зависит от font-variant-numeric : пропорциональные числа допускают различную ширину как в глифе, так и в интервале, в то время как табличные числа должны подчиняться тем же правилам, что и моноширинные шрифты.

Как насчет программного решения?

Оба "M" и "W" имеют одинаковое количество пикселей. Поскольку в большинстве ответов говорится «W», лучше показать, что M и W одинаковы и выиграны. Кстати очень хороший ответ.

Заглавная буква "М" обычно самая широкая.

Я считаю, что буква W самая широкая.

Это также зависит от шрифта. Я сделал это 1 или 2 года назад с Processing и Helvetica, и это ILJTYFVCPAXUZKHSEDORGNBQMW в порядке увеличения пикселей. Идея состоит в том, чтобы нарисовать текст на холсте с помощью шрифта, на который вы смотрите, подсчитать пиксели, а затем отсортировать с помощью HashMap или Dictionary.

Конечно, это может не иметь прямого отношения к вашему использованию, так как вычисляет площадь в пикселях, а не только ширину. Может быть, это тоже немного перебор.

В зависимости от вашей платформы может быть способ "получитьWidth" из строки или функции DrawText() с помощью свойства ширины.

Я бы сделал простой алгоритм, который использует нужный шрифт, а затем просматривает алфавит и сохраняет его в небольшой конфигурации или просто вычисляет его при инициализации, поскольку цикл от А до Я не так уж и сложен.

Arial 30px в Chrome — W побеждает.

Решение для вычисления ширины шрифтов, немного похожее на решение, опубликованное xxx, было опубликовано Алексом Майклом в его блоге (который, как ни странно, связал меня здесь).

Обзор:

Код:

Я знаю, что здесь принятым ответом является W, W означает WIN.

Однако в данном случае W также означает ширину. В тематическом исследовании использовался простой тест ширины для проверки пикселей, но это была только ширина, а не общее количество пикселей. В качестве простого контрпримера: принятый ответ предполагает, что O и Q занимают одинаковое количество пикселей, но занимают одинаковое количество места.

Таким образом, W занимает больше всего пространства. Но неужели это все пиксели, которыми он задуман?

Давайте получим некоторые эмпирические данные. Я создал изображения imgur из следующих B, M и W. Затем я проанализировал их количество пикселей (см. ниже), вот результаты:

Вот как я загружал их в холст и анализировал необработанные пиксельные данные из изображений.

Хотите узнать настоящий самый длинный глиф, а не просто угадать?
И я говорю не только о буквах, цифрах и общеупотребительных символах (!, @ и так далее). Я имею в виду самый длинный глиф из всех 32 834 символов UTF-16.
Итак, я начал с ответа @NK, у которого было программное решение, и внес изменение:

После запуска и ожидания (и ожидания) выдается результат ௌ won .
И вот он, самый длинный символ в UTF-32! Обратите внимание, что в большинстве шрифтов самый длинный глиф — ﷽, но некоторые шрифты (особенно моноширинные) перекрывают символы, как в случае со шрифтом, с которым запускалась программа.

Исходный вопрос касается английского алфавита. Вы можете создать отдельный вопрос и ответить на свой вопрос.

Это будет зависеть от шрифта. Я бы написал небольшую программу на языке программирования, который вам наиболее удобен, где вы рисуете каждую букву алфавита в растровое изображение размера n, умноженное на m. Инициализируйте каждый пиксель белым цветом. Затем подсчитайте количество белых пикселей после того, как вы нарисовали каждую букву, и сохраните это число. Наибольшее число, которое вы найдете, — это то, что вы ищете.

РЕДАКТИРОВАТЬ: Если вас на самом деле просто интересует, какой из них занимает самый большой прямоугольник (но похоже, что вы действительно после этого, а не пиксели), вы можете использовать различные вызовы API, чтобы найти размер, но это зависит от вашего языка программирования. Например, в Java вы должны использовать класс FontMetrics.

Этот код получит ширину всех символов в виде массива:

Или, если вы хотите иметь карту ширины, содержащую больше, чем просто буквенные (цифровые) символы, как описано выше (как мне нужно в среде без браузера)

Это зависит от шрифта. Например, перечеркнутый ноль занимает значительно больше места, чем обычный.

Но если бы можно было предположить, я бы выбрал X или B.

Очень активный вопрос. Заработайте 10 репутации (не считая бонуса ассоциации), чтобы ответить на этот вопрос. Требование к репутации помогает защитить этот вопрос от спама и отсутствия ответа.

Не тот ответ, который вы ищете? Просмотрите другие вопросы с тегами css char или задайте свой вопрос.

Связано

Связанные

Горячие вопросы о сети

дизайн сайта / логотип © 2022 Stack Exchange Inc; вклады пользователей под лицензией cc by-sa. версия 2022.3.24.41762

Ваш персональный компьютер представляет собой тип цифрового электронного компьютера. Он называется цифровым, потому что вся информация внутри него представлена ​​и обрабатывается в виде чисел (первоначальное значение слова «цифра» — «палец», а поскольку люди часто считают пальцами, термин «цифра» также стал применяться к числам). ). Все числа в электронной таблице, все текстовые символы в документе Word, все изображения и звуки, хранящиеся на компьютере, ВСЕ представлены в виде чисел.

Вы используете систему счисления с основанием 10 (поскольку у людей 10 пальцев, это им подходит). Когда вы пишете число 1853, например, это означает:

Каждая цифра (0–9) в числе с основанием 10 умножается на степень десяти, соответствующую ее положению. Обратите внимание, что значение каждого разряда в 10 раз превышает значение разряда справа от него. Но вы все это знали, конечно.

Двоичные числа

Но как быть с бедным компьютером, у которого нет пальцев, чтобы считать? База 10 неудобна для использования на компьютере без пальцев. Компьютеры ДЕЙСТВИТЕЛЬНО имеют электрические цепи, которые либо включены, либо выключены. Всего два состояния для работы. Таким образом, натуральная система счисления для использования в электронном компьютере — это основание 2 (так называемая двоичная система счисления). В отличие от вас, у которого есть десять цифр для вычислений (0, 1, 2, 3, 4, 5, 6, 7, 8, 9), у компьютера есть только две цифры (0 и 1), с которыми он должен все делать. Таким образом, в памяти компьютера крошечный транзистор, который включен (проводит ток), может представлять 1, а выключенный транзистор будет представлять 0 (ноль). .

Например, двоичное число 11100111101 означает:

Ах! Значит, это одно и то же число!

1853 (по основанию 10) = 11100111101 (по основанию 2)

Обратите внимание, что каждая позиция двоичной цифры в числе по основанию 2 имеет 2 значение, умноженное на позицию двоичной цифры справа от нее (поскольку это база 2; помните, как работала база 10).

Все время говорить «двоичная цифра» становится громоздко, поэтому был изобретен более короткий термин «бит». Бит — это одна двоичная цифра. Бит может содержать либо 1, либо 0 (ноль). Строка битов может содержать большие числа (точно так же, как вы используете строки из 10-кратной базы для представления чисел больше 9).

Двоичное представление чисел
Основание 10 Основание 2
0 00000000
1 00000001
2 00000010
3 00000011
4 00000100
5 00000101
. .
65 01000001
66 01000010
67 01000011
. .
254 11111110
255 11111111

Особенно удобный фрагмент компьютерной памяти имеет длину 8 бит. Этот кусок памяти может использоваться для представления любого числа от нуля (00000000) до 255 (11111111). Почему 11111111 (по основанию 2) равно 255 (по основанию 10)? Потому что это означает:

1 x 128 + 1 x 64 + 1 x 32 + 1 x 16 +
1 x 8 + 1 x 4 + 1 x 2 + 1 x 1 = 255

И почему это кусок памяти удобного размера? Потому что, если мы хотим представить все символы английского алфавита, 8 цифр — это первая степень числа 2, которая дает вам достаточно возможностей для этого (длинный 4-битный фрагмент может содержать только числа от нуля до 7. недостаточно) .

У нас есть специальное имя для фрагмента памяти длиной 8 бит: он называется байтом. Это основная единица, которую мы используем для измерения объема памяти компьютера. (Кусок памяти длиной 4 бита называется «кусок», но вам не нужно знать это для теста.)

Текстовые символы представлены в памяти компьютера в виде чисел. Как? Вам нужна схема приравнивания букв к цифрам. Используемая система называется кодом ASCII (американский стандартный код для обмена информацией). Заглавная буква A представлена ​​числом 65 в коде ASCII (65 — это 01000001 в двоичном формате). Первые 65 кодов ASCII (от 0 до 64) используются для набора управляющих символов и специальных символов, поэтому заглавная буква А оказалась 65. Заглавная буква Б равна 66 (01000010) и так далее.

td>

Как компьютер узнает, является ли 01000001 в байте памяти числом 65 или буквой A? Поскольку прикладная программа отслеживает, что и куда помещается в память, MS Word знает, что данный байт, в котором хранится текст, содержит числа, представляющие буквы.

Для иностранных алфавитов, которые содержат намного больше букв, чем английский (например, японский кандзи), теперь используется более новое расширение схемы ASCII, называемое Unicode (для хранения каждой буквы используется два байта; два байта дают 65 535 различных значений для представления символов).

Изображения также представлены в виде чисел на компьютере. Если вы внимательно посмотрите на экран своего дисплея, то увидите, что изображение на нем состоит из множества маленьких точек, называемых элементами изображения (что чаще сокращается до пикселя). Каждый пиксель изображения на экране может быть представлен в компьютере тремя байтами; числа в байтах сообщают дисплею, сколько красного, синего и зеленого света нужно смешать, чтобы получился цвет пикселя (три байта могут представлять миллионы возможных цветов для каждого пикселя).

Программы, выполняемые компьютером, также хранятся в виде чисел. Каждое число в этом случае представляет собой инструкцию для микропроцессора (каждая операция, которую может выполнить процессор, например, «выбрать число в регистр» и «сложить вместе содержимое двух резисторов», представлена ​​уникальными двоичными кодами).

Килобайты, мегабайты, гигабайты и т. д.

Емкость памяти и емкость хранилища данных для компьютеров измеряются в байтах. Размеры файлов также измеряются в байтах (помните, что один байт равен 8 битам). Однако размер байта невелик (он может содержать только один символ), поэтому мы используем более крупные единицы:

Килобайт ( КБ ) составляет примерно 1000 байт. Но это НЕ ровно 1000 байт; это 1024 байта. Почему такое странное число, как 1024? Потому что 1024 — это ровно 10000000000 в двоичном формате; хорошее число, кратное двум, очень удобно для компьютера. Так что помните: когда компьютер сообщает вам, что ваш файл занимает 40 килобайт, на самом деле он использует 40 960 байт (а не 40 000). Но вы можете думать о килобайте как о «примерно 1000 байтов», откуда он и получил свое название. Размер этого файла веб-страницы составляет примерно 20 КБ.

Точно так же вы можете думать о мегабайте ( МБ ) примерно как о миллионе байтов, но это точно 1 048 576 байт (1024 x 1024). Приложение MS Word занимает около 13 МБ на жестком диске компьютера (в зависимости от версии). Типичный персональный компьютер может иметь 512 МБ памяти.

Гигабайт ( ГБ ) равен приблизительно одному миллиарду байтов (точно 1 073 741 824). Корневое слово для слова «гига» такое же, от которого произошло наше слово «гигант», поэтому технически «гигабайт» следует произносить с мягкой «г», но допустимо произношение как с твердой, так и с мягкой «г». Емкость стандартного жесткого диска измеряется десятками или сотнями ГБ.

Если вам интересно, триллион байт – это терабайт, но возможности ПК еще не достигли этого предела.

Примечание. Чтобы еще больше запутать ситуацию, многие производители указывают емкость своих жестких дисков и других устройств в килобайтах, которые составляют ровно 1000 байт. Это имеет преимущество (для них) в том, что их продукты кажутся на 2,4% больше. Для целей этого класса мы будем использовать определение килобайта = 1024 байта.

Для определения информационного содержания сообщения требуются две формулы:

N — мощность алфавита

<р>2. \(я = к * я \)

I - информационный объем сообщения

k - количество символов в сообщении

i - информационный объем одного символа в алфавите

Формула для нахождения k:

Формула для нахождения i:

Задачи

\(i = 7 \) бит. Какова сила двойки, таков и вес одного символа в алфавите. Далее определяем информационный объем сообщения по формуле:

\(I = k * i \) ​ = 30 * 7 = 210 бит

Ответ: 210 бит

Задание №2. Информационное сообщение размером 4 КБ содержит 4096 символов. Сколько символов в алфавите, которым было написано это сообщение?

Решение. Записываем, что дано по условию задачи и что нужно найти:

Очень важно преобразовать все числа в степени двойки:

\(I = 4 \) КБ = \(2^2 \) * \(2^(13) \) = \(2^(15) \) бит

Сначала найдите вес одного символа по формуле:

\(i = \frac(\mathrm I)(\mathrm k) \) ​ = \(2^(15) \) : \(2^(12) \) = \(2^3 \) = 8 бит

Ответ: 256 символов в алфавите.

Задание №3. Сколько символов содержит сообщение, написанное с использованием 16-значного алфавита, если его размер составляет 1/16 МБ?

Решение. Записываем, что дано по условию задачи и что нужно найти:

Представьте, что \(I ​​= \frac(\mathrm 1)(\mathrm 16) \) ​ Mb в степени двойки:

1 МБ = \(2^(23) \) бит

\(I = \frac(\mathrm 1)(\mathrm 16) \) MB = \(2^(23) \) : ​\(2^4 \) = \(2^(19) \) бит.

Сначала найдите вес одного символа по формуле:

Теперь найдем количество символов в сообщении k:

\(k = \frac(\mathrm I)(\mathrm i) \) ​ = \(2^ \) ​ : \(2^2 \) = \(2^ \) = 131072

Ответ: 131072 символа в сообщении.

  • В 1 бите вы можете записать один двоичный символ.
    1 байт = 8 бит.
    В кодировке ASCII один 256-символьный код может быть записан в одном байте.
    В кодировке UNICODE один 256-символьный код занимает два байта в памяти.
    1 килобайт. = 1024 байта
    1 мегабайт = 1024 килобайта
    1 гигабайт = 1024 мегабайта
    1 терабайт = 1024 гигабайта
  • Формула Хартли 2 i = N, где i — количество информации в битах, N — неопределенность
  • Таблица степеней двойки, показывающая, сколько информации можно закодировать с помощью i-битов

Представление символов ASCII (просто пример )
Символ Основание 10 Основание 2
(возврат ) 13 00001101
(пробел) 32 00100000
! 33 00100001
1 49 00110001
2 50 00110010
@ 64 01000000
A 65 01000001
B 66 01000010
C 67 01000011
a 97 01100001
b 98 01100010
c 99 01100011
(удалить) 127 01111111
< td>3 < td>4
i 0 1 2 4 5 6 7 8 9 10 11 12 13 14 15 16
N=2 i 1 2 8 16 32 64 128 256 512 1024 2048 4096 8192 6384 32768 65536

Например: двоичный текст 01010111 занимает в памяти 8 бит.
Тот же текст в кодировке ASCII занимает 8 байт или 64 бита.
Тот же текст UNICODE занимает 16 байт или 128 бит.

Мощность алфавита — это количество символов в алфавите или неопределенность по формуле Хартли.

Информационным весом одного символа является значение i из формулы Хартли.

Из этого можно сделать вывод, что не существует алфавита, состоящего из одного символа, так как тогда информационный вес этого символа был бы равен 0.

Чтобы преобразовать байты в килобайты, разделите количество байтов на 1024.
Например: 2048 байтов будут 2 килобайтами. И так далее в следующих единицах измерения.

Чтобы преобразовать байты в биты, нужно умножить количество байтов на 8.
Например: 3 байта будут 24 битами.

Чтобы перевести килобайты в байты, нужно количество килобайт умножить на 1024.
Например: в 3 килобайтах будет 3072 байта и, соответственно, 24576 бит. и т. д.

Для определения часа прибытия поезда нужно задать 5 вопросов, иными словами, получить 5 бит информации, так как неопределенность равна 24.

Чтобы из 64 монет найти фальшивую, нужно сделать 6 взвешиваний.

Количество символов в тексте = информационный вес всего текста: информационный вес одного символа

Задание. Информационный объем текста, набранного на компьютере с использованием кодировки UNICODE (каждый символ кодируется 16 битами), составляет 2 Кб. Определить количество символов в тексте.
Решение. Для определения количества символов в тексте необходимо знать информационный объем всего текста и информационный вес одного символа.
Однако перед выполнением деления необходимо привести значения к одинаковым единицам измерения.
2 кб = 2 х 1024 = 2048 байт весь объем информации.
Каждый символ кодируется 16 битами или 2 байтами. Отсюда 2048:2 = 1024 символа в тексте.

Информационные единицы

<р>1. Задача на использование первой основной формулы.
Каждый символ алфавита записывается с помощью 4 двоичных цифр. Сколько символов в этом алфавите?
Каждый символ алфавита записывается с помощью 6 цифр двоичного кода. Сколько символов в этом алфавите?
Каждый символ алфавита записывается с помощью 3 цифр двоичного кода. Сколько символов в этом алфавите?
Каждый символ алфавита записывается с помощью 5 цифр двоичного кода. Сколько символов в этом алфавите?

<р>2. Обратная задача для использования первой основной формулы.
Алфавит для написания сообщений состоит из 32 символов. Каков информационный вес одного символа? Не забудьте указать единицу измерения.
Алфавит для написания сообщений состоит из 64 символов. Каков информационный вес одного символа? Не забудьте указать единицу измерения.
Алфавит для написания сообщений состоит из 16 символов. Каков информационный вес одного символа? Не забудьте указать единицу измерения.
Алфавит для написания сообщений состоит из 128 символов. Каков информационный вес одного символа? Не забудьте указать единицу измерения.

<р>3. Задание НА использование второй формулы.
Информационный объем текста, набранного на компьютере с использованием кодировки UNICODE (каждый символ кодируется 16 битами), составляет 4 Кб. Определить количество символов в тексте.
Информационное сообщение размером 1,5 Кб содержит 3072 символа. Определить информационный вес одного символа используемого алфавита в битах.
Информационный объем текста, набранного на компьютере с использованием кодировки UNICODE (каждый символ кодируется 16 битами), составляет 0,5 Кб. Определить количество символов в тексте.
Информационное сообщение размером 3 КБ содержит 3072 символа. Определить информационный вес одного символа используемого алфавита в битах.

<р>4. Задача на соотношение единиц измерения информации без использования степеней.
Размер информационного сообщения 8192 бит. Выразите в килобайтах.
Информационный объем сообщения составляет 12 288 бит. Каков объем одного и того же сообщения в килобайтах?
Размер информационного сообщения 1 6 384 бит. Выразите в килобайтах.
Информационный объем сообщения составляет 4096 бит. Каков объем одного и того же сообщения в килобайтах?

<р>5. Проблема соотношения единиц измерения информации с помощью градусов.
Сколько битов информации содержит сообщение размером 4 МБ? Дайте ответ в степени 2.
Сколько битов информации содержит сообщение размером 16 МБ? Дайте ответ в степени 2.
Сколько битов информации содержит сообщение размером 2 МБ? Дайте ответ в степени двойки.
Сколько битов информации содержит сообщение размером 8 МБ? Дайте ответ в степени двойки.

<р>6. Задача на использование двух формул.
Сообщение, написанное буквами 256-символьного алфавита, содержит 256 символов. Сколько информации он несет в килобайтах?
Сообщение, написанное буквами 16-значного алфавита, содержит 512 символов. Сколько информации он несет в килобайтах?
Сколько символов содержит сообщение, написанное с использованием 16-значного алфавита, если его объем составлял 1/16 килобайта?
Объем сообщения, содержащего 16 символов, составлял 1/512 килобайта. Каков размер алфавита.

<р>7. «Текстовая» задача на использование основной формулы.
Сколько существует различных звуковых сигналов, состоящих из последовательностей коротких и длинных гудков? Длина каждого сигнала составляет 6 колец.
Световая панель состоит из лампочек, каждая из которых может находиться в двух состояниях ("включено" или "выключено"). Какое минимальное количество лампочек должно быть на табло, чтобы оно могло передавать 150 различных сигналов?
Зрительный зал представляет собой прямоугольную площадь зрительских мест: 12 рядов по 10 мест. Какое минимальное количество битов требуется для кодирования каждого местоположения в автоматизированной системе?
Каждый пиксель цветного изображения кодируется 1 байтом. Сколько цветов на этом изображении?

<р>8. «Текстовая» задача на использование двух формул.
Метеостанция следит за влажностью воздуха. Результатом одного измерения является целое число от 20 до 100%, которое записывается с использованием минимально возможного количества битов. Станция произвела 80 измерений. Определить информативность результатов наблюдений,
Метеостанция следит за атмосферным давлением. Результатом одного измерения является целочисленное значение от 700 до 780 мм рт.ст., которое записывается с использованием минимально возможного количества битов. Станция произвела 80 измерений. Определить информационный объем результатов наблюдения.
Метеостанция следит за влажностью воздуха. Результатом одного измерения является целое число от 40 до 100%, которое записывается с использованием минимально возможного количества битов. Станция произвела 50 измерений. Определить информационный объем результатов наблюдения.
Метеостанция следит за атмосферным давлением. Результатом одного измерения является целочисленное значение от 740 до 760 мм рт.ст., которое записывается с использованием минимально возможного количества битов. Станция произвела 70 измерений. Определить информативность результатов наблюдения.

<р>9. Проблема передачи информации с помощью модема.
Скорость передачи данных через соединение ADSL составляет 512000 бит/с. По этому соединению передается файл размером 1500 Кб. Укажите время передачи файла в секундах.
Скорость передачи данных через соединение ADSL составляет 1024000 бит/с. По этому соединению передается файл размером 2500 Кб. Укажите время передачи файла в секундах.
Скорость передачи данных через соединение ADSL составляет 1024000 бит/с. Передача файла по этому соединению заняла 5 секунд. Укажите размер файла в килобайтах.
Скорость передачи данных через соединение ADSL составляет 512000 бит/с. Передача файла по этому соединению заняла 8 секунд. Укажите размер файла в килобайтах.

<р>10. Проблема передачи графической информации.
Определите скорость модема, если он может передать растровое изображение размером 640 x 480 пикселей за 256 секунд. На пиксель приходится 3 байта.
Сколько секунд требуется модему, передающему информацию со скоростью 56 000 бит/с, для передачи цветного растрового изображения размером 640 x 480 пикселей, если предположить, что цвет каждого пикселя закодирован тремя байтами?
Определите скорость модема, если он может передать растровое изображение размером 640 x 480 пикселей за 132 секунды. На пиксель приходится 3 байта.
Сколько секунд требуется модему, передающему информацию со скоростью 28800 бит/с, для передачи цветного растрового изображения размером 640 x 480 пикселей, если предположить, что цвет каждого пикселя закодирован тремя байтами?

Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видеоинформацию. Все эти виды информации представлены в компьютере в двоичном коде, то есть используются только два символа 0 и 1.Это связано с тем, что информацию удобно представлять в виде последовательности электрических импульсов: нет импульса (0), есть импульс (1).

Такое кодирование обычно называют двоичным, а сами логические последовательности нулей и единиц — машинным языком.

Какой длины должен быть двоичный код, чтобы можно было кодировать символы клавиатуры вашего компьютера?

Таким образом, информационный вес одного символа достаточного алфавита составляет 1 байт.

Для измерения больших объемов информации используются более крупные единицы информации:

Читайте также: