Текст занимает 1 8 кбайт памяти компьютера, сколько символов содержит этот текст
Обновлено: 21.11.2024
Каждый файл на компьютере использует определенное количество ресурсов при отправке через Интернет или сохранении. Помня о своих килобайтах (КБ) и мегабайтах (МБ), вы можете предотвратить проблемы и обеспечить более плавную работу в Интернете. Это руководство GreenNet поможет вам отличить китов от пескарей.
Компьютерные ресурсы имеют физические пределы своих возможностей, даже если идею компьютерных ресурсов можно масштабировать до бесконечности. Поэтому мы действительно хотим думать о размерах файлов аккуратно, минималистично и, таким образом, максимально использовать ресурсы, которые у нас уже есть. Хотя большинство людей в настоящее время, кажется, имеют подключение к Интернету, которое легко справляется с аудио, видео и изображениями с высоким разрешением, стоит помнить, что многие люди этого не делают. Если не позаботиться, можно создать большой мультимедийный файл, который на самом деле передает людям не больше информации, чем файл в десятую или сотую часть размера.
Программные пакеты, которые потребляют слишком много памяти и места на диске для выполнения своих функций, иногда называют "раздутыми программами", и аналогичную эстетику можно применить к медиафайлам. Например, размещение расшифровок на веб-сайте может помочь людям быстрее находить нужную им информацию, чем только аудио- или видеоинтервью. Точно так же вы можете подумать, будет ли людям, в том числе с нарушениями зрения, проще прочитать дату и время события из текстового сообщения электронной почты или открыть большой PDF-файл или файл изображения плаката. (Кстати, термин Microsoft «документ» для файлов так и не прижился. В данном контексте эти два слова являются синонимами.)
Итак, насколько большим является слишком большой? Очевидно, это зависит от контекста. Если вы подписываете отчет, который предназначен для печати, то вполне разумно отправить по электронной почте вложение в формате PDF размером 10 МБ нескольким людям с просьбой дать окончательные комментарии. Что было бы неразумно, так это отправить готовый 10-мегабайтный файл по электронной почте вашему списку из 2000 сторонников. Вместо этого вы можете создать версию PDF с более низким разрешением или даже текстовую версию, разместить ее на своем веб-сайте и отправить по электронной почте ссылку на файл, возможно, с небольшим указанием размера файла (например, «[1,2 МБ PDF] ") рядом со ссылкой для скачивания.
Зачем беспокоиться о размере файла, если человеку с высокоскоростным широкополосным доступом в Интернет требуется всего 15 секунд, чтобы загрузить файл размером 10 МБ?
Несмотря на то, что у некоторых людей загрузка может занять 15 секунд (например, широкополосный доступ GreenNet ADSL2+ со скоростью "до" 12 Мбит/с), 10 % домашних интернет-соединений в Великобритании по состоянию на 2009 год по-прежнему осуществляются с коммутируемым доступом, во многих других странах этот показатель выше. . Загрузка 10 МБ по телефонной линии может занять около часа. При более старых широкополосных соединениях или в сельской местности скорость загрузки может составлять 512 кбит/с, а передача по-прежнему занимает несколько минут. Даже при самом быстром широкополосном доступе скорость загрузки часто ограничена 256 кбит/с, поэтому, если вы ожидаете повторной передачи файла размером 10 МБ, это, скорее всего, будет медленнее, чем ожидалось.
Большой файл сам по себе не представляет проблемы, но если его умножить на размер аудитории, это может привести к проблемам с пропускной способностью, которые повлияют на интернет-провайдеров и других пользователей. Передача также потребляет большее количество энергии, что может привести к необходимости модернизации аппаратной части (до 80% энергии за время жизни компьютерной техники «воплощается», то есть при ее изготовлении). GreenNet не ограничивает пропускную способность, но подчиняется политике «добросовестного использования».
После загрузки большие файлы труднее манипулировать. Большие электронные письма могут замедлить доступ к почтовому ящику и увеличить размер файлов почтовых ящиков на компьютерах получателей. Большие файлы изображений на веб-странице часто должны масштабироваться программным обеспечением браузера, а это означает, что навигация и прокрутка страницы могут быть медленными и беспорядочными. (Есть и другие факторы, которые могут вызвать медленную "отрисовку" страницы, например, Javascript или сложная "внутренняя часть" веб-сайта.)
Тогда есть резервная копия. Если кто-то намеревается сохранить документ или изображение или заархивировать всю электронную почту, он может быть многократно реплицирован на резервном носителе. Люди также могут не захотеть хранить файлы, которые занимают больше памяти, чем они того стоят, и поэтому удаляют их.
Это все еще 15 секунд, даже если это фоновая загрузка. Некоторым из нас не терпится дождаться компьютера более полсекунды.
Что на самом деле означает каждая единица памяти компьютера?
Короче говоря, префиксы "кило-", "мега-", "гига-" и "тера-" аналогичны их использованию в любых других единицах измерения, таких как метры или ватты:
- 1 Б = 1 байт;
- 1 КБ = 1000 байт;
- 1 МБ = 1000 КБ;
- 1 ГБ = 1000 МБ или 1 000 000 000 байт.
(Чтобы запутать ситуацию, «1 КБ» или «1 КБ» используются многими компьютерщиками для обозначения 1024 байтов, что является удобным числом в двоичном формате, а память или диск часто выделяются операционными системами в единицах 1024.Чтобы избежать этой путаницы со стандартным научным использованием «мега-» и т. д., термины «кибибайт» (КиБ), «мебибайт» (МиБ), «гибибайт» (ГиБ) и «тебибайт» теперь рекомендуются для этих не- десятичные технические единицы. Вы все еще можете чувствовать себя обделенным, если купили флэш-накопитель на 4 ГБ, а его объем составляет всего 3,725 ГБ. Для простоты в этой статье мы будем использовать круглые тысячи и килобайты [кБ].)
Как посмотреть размеры файлов?
Размер файла или вложения обычно легко доступен, если он еще не заметен. В Windows щелчок правой кнопкой мыши на любом файле, папке или диске и выбор «Свойства» покажет размер. В окне Проводника вы можете выбрать «Подробности» в меню «Вид»; или в диалоговом окне открытия или сохранения файла есть кнопка «Просмотр», из которой вы также можете выбрать «Подробности». Если вы затем нажмете слово «Размер» в верхней части столбца, вы можете сгруппировать самые большие файлы в папке. В Mac OS X можно нажать Command+i, чтобы отобразить сведения об отдельном файле, или Command+Option+i, чтобы отобразить сведения обо всех выбранных элементах в окне Инспектора. Эквивалент представления «Подробности» для Mac — это представление «Список», а сочетание клавиш Command+J дает возможность «рассчитать все размеры» как папок, так и файлов.
Большинство почтовых программ, таких как Windows Mail или Thunderbird, всегда отображают размер вложений рядом с именем файла. В Thunderbird (и многих других программах) вы можете нажать кнопку столбцов в правом верхнем углу списка, чтобы добавить столбец, показывающий размер каждого элемента. FTP-программы, используемые для передачи файлов на веб-сайты, почти все показывают размер файлов по умолчанию, хотя обычно в байтах, поэтому вам нужно разбить эти большие числа на глаз на группы из трех цифр, чтобы увидеть, какие из них измеряются в B или kB, а который в МБ.
Таблица приблизительных размеров файлов
Трехминутный звук в формате MP3 с очень высоким битрейтом (256 кбит/с);
1 минута видео в низком разрешении или потокового видео с сайта обмена видео;
все опубликованные файлы кабельного шлюза Wikileaks к середине декабря 2010 г.;
20-страничный PDF-файл, который может включать неудачно выбранную обложку;
полное собрание сочинений Шекспира (без сжатия)
Изображения
Как вы уже поняли, одним из основных факторов, определяющих громоздкость файла, является качество или разрешение изображений. Изображение с разрешением 300 dpi (точек или пикселей на дюйм), добавленное в текстовый процессор или файл PDF, занимает примерно в четыре раза больше места, чем изображение с разрешением 150 dpi (поскольку разрешение применяется как по горизонтали, так и по вертикали). Теперь, если вам нужно поделиться изображением с кем-то в Интернете, либо на веб-сайте, либо по электронной почте, и вы не ожидаете, что он распечатает его, а также не ожидаете идеальной копии или увеличения для изучения мельчайших деталей, тогда это будет только быть показаны на экране. Так что стоит немного узнать о разрешениях экрана. Типичный плоский экран имеет ширину 1280 пикселей. Тем не менее, некоторые из них могут иметь меньшее или более низкое разрешение, и с учетом навигационных панелей и полей по бокам экрана, а также того, что веб-браузер посетителя может не занимать весь экран, вероятно, нет особого смысла в загрузке изображения, которое шире 800 пикселей. Все, что больше, и зритель может видеть только верхний левый угол изображения и должен прокручивать, чтобы увидеть остальное.
Отсканированные или цифровые фотографии могут быть в 20 раз больше, но при этом не казаться более четкими для получателя. Поэтому, если у вас есть такое изображение, вам нужно будет изменить его размер или уменьшить перед загрузкой или публикацией. Распространенной ошибкой при создании веб-страницы является попытка изменить размер изображения на странице путем изменения свойств элемента изображения. Некоторые системы управления контентом, такие как Drupal, могут включать в себя модуль изображения, который автоматически создает масштабированную копию изображения указанного вами размера, но если вы редактируете страницы в веб-программах, таких как Dreamweaver или KompoZer, шансы вы вынуждаете каждого посетителя веб-сайта загружать слишком много информации, а затем заставляете их компьютер работать очень усердно, выполняя уменьшение масштаба. Поэтому лучше стараться, чтобы фотоизображения, даже баннеры, не превышали 800 пикселей в поперечнике и, возможно, не превышали 50 КБ. Любое программное обеспечение для редактирования изображений, такое как GIMP с открытым исходным кодом, позволяет легко создавать файлы меньшего размера. Просто откройте большой файл, выберите функцию "размер изображения" или "масштабирование изображения", выберите нужную ширину, помня, что 800 пикселей часто соответствует полной ширине, и сохраните файл в подходящем формате.
Еще одна вещь, которую следует учитывать при работе с изображениями, – это различные преимущества различных видов сжатия и форматов файлов. Как упоминалось выше, файлы JPEG (также называемые файлами .jpg, потому что Windows когда-то была ограничена 3-символьными расширениями) чаще всего используются для фотографии, а формат JPEG используется почти во всех цифровых камерах. Они сохраняют полный диапазон цветов, но теряют определенное количество мелких деталей; существует баланс между размером файла и допустимым количеством искажений. Высокосжатый JPEG может иметь эффект интерференции Фурье, но большинство людей этого не заметят.В основном вам понадобится качество JPEG среднего уровня около 50 (из 100). Другими основными форматами, используемыми в Интернете, являются PNG или более старый GIF, и это форматы «без потерь», которые не подходят для фотографий или полноцветных сканирований произведений искусства. Однако для таких изображений, как штриховые рисунки или логотипы, которые были созданы на компьютере, выбор PNG позволяет очень эффективно сжимать области плоского цвета и сохранять четкие края дизайна, которые потеряет JPEG. PNG также имеет тенденцию использоваться для небольших изображений, поскольку для больших изображений гораздо важнее уменьшение размера за счет использования JPEG. Следующие изображения иллюстрируют, почему JPG не используется для небольших файлов с небольшим количеством цветов:
В килобайте 1024 байта, а в мегабайте 1024 килобайта, поэтому документ размером 1 КБ будет содержать 1024 байта данных или 1024 символа текста и другой программной информации, описывающей форматирование документа и другие характеристики, чтобы его можно было открыть. и используется программным приложением, таким как Adobe Acrobat или Microsoft Word.
Изображения представлены на экране в виде пикселей или цветных точек, но могут быть созданы в различных форматах, требующих для хранения файлов самых разных размеров. Для каждого изображения требуется разное количество байтов на пиксель, чтобы определить цвет и расположение каждого пикселя на экране. Черно-белые изображения требуют меньше места, чем изображения в оттенках серого или цветные из-за количества байтов, необходимых для уникального описания каждого цвета. Изображения могут быть выражены во многих форматах, и некоторые большие форматы файлов, такие как изображения TIFF, являются "без потерь" - это означает, что каждый пиксель (точка цвета на вашем экране) получает свой собственный набор байтов для его описания. При равных цветах и других факторах изображение размером 100x100 пикселей (всего = 1000 пикселей) требует примерно в 10 раз больше места для хранения, чем изображение 10x10 пикселей (всего = 100 пикселей). Для сравнения, для представления одного символа текста, занимающего на экране пространство размером 10 x 10 пикселей, обычно требуется всего один байт.
Если вы поместите отсканированные изображения TIFF в файл PDF, вы обнаружите, что объем пространства, необходимый для нового файла PDF, превышает объем места, занимаемого только изображениями TIFF. Это связано с тем, что в файл PDF встроена информация, описывающая, как просматривать и интерпретировать изображения TIFF в средстве просмотра PDF, а также информация (метаданные) для описания самого файла.
Вы обнаружите, что полная страница электронного текста значительно меньше, чем отсканированное изображение TIFF того же текста, когда оно добавляется в файл PDF.
Разница в размере файла txt выше представляет собой то, что добавлено, чтобы сделать его файлом PDF.
Файл PDF, содержащий 8-битный файл TIFF 10x10 с буквой "a" (такой же размер на экране, как и исходный текст)
Хотя точное количество текстовых данных в килобайте (КБ) или мегабайте (МБ) может варьироваться в зависимости от характера документа, килобайт может содержать около половины страницы текста, а мегабайт — около 500 страниц. текста. Текст в цифровом файле преобразуется в двоичные данные, которые обозначают буквы и цифры с помощью выражений из единиц и нулей. Файлы большего размера содержат больше этих данных, что, в свою очередь, эквивалентно большему количеству типизированной информации.
Один мегабайт может содержать около 500 страниц текста, что сопоставимо с одной толстой книгой.
Двоичные файлы и биты
Большинство современных компьютеров представляют собой двоичные системы и работают с битами данных. Бит — это самая основная единица информации, которая может иметь два состояния: обычно указывается как 0 или 1. Длинные строки этих битов могут представлять большинство типов информации, включая текст, изображения и музыку. Однако чистая двоичная информация бесполезна для людей, которые не научились читать и писать в двоичном формате. Двоичное число 11000101110, например, эквивалентно 1582.
Планшетный компьютер может иметь гигабайты памяти, способные хранить тысячи книг.
Группировка битов в байты
Чтобы сделать данные более доступными и упрощенными, группы битов объединяются в байты. один байт состоит из 8 бит. Набор из 8 битов был выбран потому, что он обеспечивает 256 возможных вариантов, что достаточно для указания букв, цифр, пробелов, знаков препинания и других расширенных символов. Само это предложение, например, состоит из 125 байтов, потому что в нем 125 букв, цифр, пробелов и знаков препинания.Имейте в виду, что это представляет собой только чистый текст; некоторые текстовые редакторы включают в себя другие типы данных форматирования, поэтому размер файла становится больше, чем просто количество символов в файле.
Большинство компакт-дисков содержат около 750 мегабайт данных.
Количество текста
Килобайт — это 1 024 байта, часто для простоты округляемых до 1 000; в то время как мегабайт составляет 1 048 576 байтов, или около 1 миллиона. Подсчитано, что килобайт может вместить около половины машинописной страницы. Поэтому для одной полной страницы требуется около 2 КБ. На следующей диаграмме показано количество байтов в общепринятых терминах, таких как килобайты и мегабайты, а также объем текста, который может храниться в каждом из них.
Имя | Количество байтов | Количество текста td> |
Килобайт (КБ) | 2 10 или 1024 | 1/2 страницы |
2 20 или 1 048 576 | 500 страниц или 1 толстая книга | |
Гигабайт (ГБ) td> | 2 30 или 1 073 741 824 | 500 000 страниц или 1000 толстых книг |
Терабайт (ТБ) | 2 40 или 1 099 511 627 776 | 1 миллион толстых книг |
Петабайт | 2 50 или 1 125 899 906 842 624 | 180 библиотек Конгресса< /td> |
Exabyte | 2 60 или 1 152 921 504 606 846 976 | 180 тысяч библиотек Конгресса |
Zettabyte | 2 70 или 1 180 591 620 717 411 303 424 | 180 миллионов библиотек Конгресса |
Yottabyte | 2 80 или 1 208 925 819 614 629 174 706 176 | 180 миллиардов библиотек Конгресса |
Библиотека Конгресса
Библиотека Конгресса в Вашингтоне, округ Колумбия, считается крупнейшей в мире библиотекой с более чем 28 миллионами томов. Цифры, указанные в приведенной выше таблице, основаны на предположении, что средняя книга состоит из 200 страниц. Это означает, что для хранения цифровой резервной копии всей Библиотеки Конгресса потребуется около 28 ТБ дискового пространства.
Портативное хранилище мультимедиа
Большинство компакт-дисков (CD) содержат около 750 МБ, что примерно эквивалентно 375 000 страниц текста. Цифровые универсальные диски (DVD) могут хранить 4,7 ГБ или 2,3 миллиона страниц. Диски Blu-Ray могут содержать 27 ГБ или 13,5 миллионов страниц, что примерно эквивалентно тексту, содержащемуся в 67 500 книгах. Такие устройства, как электронные книги и планшетные компьютеры, часто имеют многогигабайтную память, что делает их идеальными для хранения тысяч книг.
Гигабайт может содержать информацию, эквивалентную примерно 1000 толстых книг.
Объекты данных TEXT, как следует из названия, полезны для хранения длинных текстовых строк в базе данных MySQL. Четыре типа объектов данных TEXT созданы для хранения и отображения значительных объемов информации, в отличие от других типов объектов данных, которые полезны для таких задач, как сортировка и поиск столбцов или обработка небольших параметров на основе конфигурации для более крупного проекта. Различные объекты TEXT предлагают диапазон памяти от 1 байта до 4 ГБ и не предназначены для хранения вычислительных значений. Обычно они используются для хранения описаний продуктов для сайта продаж, сводок свойств для базы данных недвижимости и подробного текста статьи на новостном веб-сайте. Объекты TEXT лучше всего использовать, когда VARCHAR и другие объекты данных на основе строк недостаточны для хранения желаемого объема информации. Однако самый маленький тип TEXT, TINYTEXT, имеет ту же длину символов, что и VARCHAR. Объекты TEXT отличаются от других типов хранения строк тем, что устраняют требование указывать длину хранения, не удаляют байты при выборе и не заполняют неиспользуемое символьное пространство для эффективного хранения на диске. Поскольку объекты TEXT не хранятся в памяти сервера, для их извлечения требуются дополнительные данные. Следующие размеры предполагают, что база данных использует кодировку UTF-8.
TINYTEXT: 255 символов — 255 Б
Объект данных TINYTEXT – наименьший из объектов семейства TEXT. Он предназначен для эффективного хранения коротких информационных строк. Этот тип может хранить до 255 байт (выражается как 2^8 -1) или 255 символов и требует служебных данных в 1 байт. Этот объект можно использовать для хранения таких вещей, как краткие сводки, URL-ссылки и другие более короткие объекты. TINYTEXT превосходит VARCHAR при хранении данных длиной менее 255 символов с непостоянной длиной, которые не нужно использовать для критериев сортировки.
ТЕКСТ: 65 535 символов — 64 КБ
Стандартный объект данных TEXT в достаточной степени способен обрабатывать типичное длинное текстовое содержимое.Объекты данных TEXT имеют максимальный размер 64 КБ (выражается как 2 ^ 16 -1) или 65 535 символов и требуют служебных данных в 2 байта. Он достаточно большой, чтобы вместить текст, например, статьи, но его недостаточно, чтобы вместить текст всей книги.
MEDIUMTEXT: 16 777 215 – 16 МБ
Объект данных MEDIUMTEXT полезен для хранения больших текстовых строк, таких как официальные документы, книги и резервные копии кода. Эти объекты данных могут иметь размер до 16 МБ (выражается как 2^24 -1) или 16 777 215 символов и требуют 3 байта служебной памяти.
LONGTEXT: 4 294 967 295 символов — 4 ГБ
Объект данных LONGTEXT предназначен для использования в экстремальных случаях использования хранилища текстовых строк. Это приемлемый вариант, когда объект MEDIOMTEXT недостаточно велик. Компьютерные программы и приложения часто достигают длины текста в диапазоне LONGTEXT. Эти объекты данных могут иметь размер до 4 ГБ (выражаться как 2^32 -1) и хранить до 4 294 967 295 символов с 4 байтами служебной памяти,
ТЕКСТ и BLOB
BLOB-объекты – это альтернативный тип хранилища данных, который использует одинаковые механизмы именования и емкости с объектами TEXT. Однако BLOB-объекты представляют собой двоичные строки без сортировки по набору символов, поэтому они обрабатываются как числовые значения, а объекты TEXT обрабатываются как строки символов. Эта дифференциация важна для сортировки информации. BLOB используются для хранения файлов данных, таких как изображения, видео и исполняемые файлы.
Читайте также: