Сколько бит необходимо для хранения слова информатика на диске в системе кодирования ascii

Обновлено: 05.07.2024

Этот контент был заархивирован и больше не поддерживается Университетом Индианы. Информация здесь может быть неточной, а ссылки могут быть недоступны или ненадежны.

Примечание. Следующая информация частично предоставлена ​​проектом Extreme Science and Engineering Discovery Environment ( XSEDE ) Национального научного фонда (NSF), который предоставляет исследователям передовые цифровые ресурсы и услуги, облегчающие научные открытия. Дополнительную информацию см. на веб-сайте XSEDE.

Бит — это двоичная цифра, наименьший приращение данных на компьютере. Бит может содержать только одно из двух значений: 0 или 1, что соответствует электрическим значениям выключено или включено соответственно.

Поскольку биты очень малы, вы редко работаете с информацией по одному биту за раз. Биты обычно собираются в группу из восьми, чтобы сформировать байт. Байт содержит достаточно информации для хранения одного символа ASCII, например "h".

Килобайт (КБ) — это 1 024 байта, а не тысяча байтов, как можно было бы ожидать, потому что компьютеры используют двоичную систему (с основанием два) вместо десятичной (с основанием десять).

Хранилище и память компьютера часто измеряются в мегабайтах (МБ) и гигабайтах (ГБ). Роман среднего размера содержит около 1 МБ информации. 1 МБ – это 1 024 килобайта, или 1 048 576 (1024 x 1024) байт, а не миллион байт.

Точно так же один 1 ГБ равен 1024 МБ или 1 073 741 824 (1024 x 1024 x 1024) байт. Терабайт (ТБ) равен 1024 ГБ; 1 ТБ — это примерно такой же объем информации, как и все книги в большой библиотеке, или примерно 1610 компакт-дисков с данными. Петабайт (ПБ) равен 1024 ТБ. 1 ПБ данных, записанных на DVD, создаст примерно 223 100 DVD, т. е. стопку высотой около 878 футов или стопку компакт-дисков высотой в милю. Университет Индианы в настоящее время создает системы хранения, способные хранить петабайты данных. Эксабайт (ЭБ) равен 1024 ПБ. Зеттабайт (ZB) равен 1024 ЭБ. Наконец, йоттабайт (YB) равен 1024 ZB.

Многие производители жестких дисков используют десятичную систему счисления для определения объема дискового пространства. В результате 1 МБ определяется как один миллион байтов, 1 ГБ определяется как один миллиард байтов и так далее. Поскольку ваш компьютер использует двоичную систему, как указано выше, вы можете заметить несоответствие между опубликованной емкостью вашего жесткого диска и емкостью, подтвержденной вашим компьютером. Например, жесткий диск, который, как говорят, содержит 10 ГБ дискового пространства с использованием десятичной системы счисления, на самом деле способен хранить 10 000 000 000 байтов. Однако в двоичной системе 10 ГБ составляют 10 737 418 240 байт. В результате вместо подтверждения 10 ГБ ваш компьютер подтвердит 9,31 ГБ. Это не неисправность, а вопрос разных определений.

Мы считаем по основанию 10 по степеням 10:

Компьютеры считают по основанию 2:

Итак, на компьютерном жаргоне используются следующие единицы:

< /th> < td>1 048 576 байт

Примечание. Названия и сокращения для количества байтов легко спутать с обозначениями для битов. В сокращениях для количества битов используется строчная буква «b» вместо прописной «B». Поскольку один байт состоит из восьми битов, эта разница может быть значительной. Например, если рекламируется широкополосное подключение к Интернету со скоростью загрузки 3,0 Мбит/с, его скорость составляет 3,0 мегабита в секунду или 0,375 мегабайта в секунду (сокращенно 0,375 Мбит/с). Биты и скорости передачи данных (биты во времени, например, в битах в секунду [бит/с]) чаще всего используются для описания скорости соединения, поэтому уделяйте особое внимание при сравнении поставщиков и услуг подключения к Интернету.

Этот документ был разработан при поддержке грантов Национального научного фонда (NSF) 1053575 и 1548562. Любые мнения, выводы, выводы или рекомендации, выраженные в этом материале, принадлежат авторам и не обязательно отражают точку зрения НФС.

– В этом разделе представлен краткий обзор компьютерного оборудования и программного обеспечения, чтобы учащиеся имели общее представление о том, как работают компьютеры, и узнают некоторые общепринятые компьютерные термины.

– Важные темы более подробно рассматриваются в следующих разделах

- Компьютерные данные кодируются, обрабатываются и сохраняются с использованием эксклюзивного условия с двумя состояниями

– В английском языке такие формы информации с двумя состояниями могут включать да/нет, вкл/выкл, открыто/закрыто, отверстие/нет отверстия

- Простыми электронными терминами это состояние с двумя состояниями может быть переведено для компьютера как "переключатель разомкнут/замкнут", что означает "электричество проходит по цепи/электроэнергия по цепи не проходит"

- Обратите внимание, что всегда существует одно из двух монопольных состояний

  • Если один коммутатор предоставляет два разных данных, сколько данных мы можем получить от двух коммутаторов?
  • Четыре — есть четыре комбинации разомкнутых и замкнутых переключателей.

Двоичная запись

- в компьютерной терминологии это состояние с двумя состояниями представлено в двоичной записи с использованием 1 и 0

- таким образом, два переключателя выдают четыре кода - 00, 01, 10, 11

- три переключателя дают восемь кодов - 000, 001, 010, 011, 100, 101, 110, 111

- в математических терминах:

- 1 двоичная цифра дает 2 1 = 2 альтернативы

- 2 двоичных разряда дают 2 2 = 4 альтернативы

- 3 двоичных разряда дают 2 3 = 8 вариантов

- 8 двоичных цифр дают 2 8 = 256 альтернатив

СИЛА 2

Биты и байты

- Каждая двоичная цифра называется битом

- сложность компьютерной схемы описывается количеством битов, которые могут быть переданы одновременно

- это определяется количеством проводов, которые проходят параллельно друг другу на печатных платах

- современные ПК используют 8-, 16- и 32-битные пути

- группа из 8 бит называется байтом

байты — стандартная единица измерения компьютерных данных

Система кодирования ASCII

Американский стандартный код для обмена информацией

– для максимальной эффективности большинство компьютеров хранят данные в собственных внутренних форматах

- однако для передачи данных необходимо использовать стандартные коды, понятные всем системам

- наиболее успешным стандартом является ASCII (произносится как ass-key)

- ASCII появился задолго до компьютерной коммуникации как код для телетайпов

- ASCII присваивает числам от 0 до 127-128 символов, включая буквы верхнего и нижнего регистра, цифры от 0 до 9 и различные специальные символы

- 128 различных шаблонов могут быть сгенерированы с использованием 7 битов в различных комбинациях включения и выключения

- Таким образом, любой символ ASCII может быть закодирован с помощью 7 бит

- ������ на практике используется 8 бит (один байт), дополнительный бит может использоваться для расширения кода до 128 дополнительных символов, или он просто может быть избыточным

ДВОИЧНАЯ ОБОЗНАЧЕНИЕ

- с помощью двоичной записи эти коды могут быть преобразованы в десятичные числа

- считая справа, 8 бит пронумерованы от 0 до 7 и означают следующее:

Бит: 7 6 5 4 3 2 1 0

128 с 64 с 32 с 16 с 8 с 4 с 2 с единицы

- напр. комбинация 01010101

нет 128, один 64, нет 32, один 16, нет 8, один 4, нет двойки и одна единица

т.е. 64+16+4+1 = 85

- В кодовой системе ASCII кодовое число 85 представляет собой заглавную букву U

Таким образом, чтобы сохранить U, система сохраняет байт с битовой комбинацией 01010101

- В коде ASCII символы от 0 до 32 часто выполняют специальные функции

- например. символ 7, 00000111, является символом BEL и звонит в звонок, если он получен многими терминалами или устройствами

- например. символ 12, 00001100, является символом FF и вызывает перевод страницы (новая страница), если он получен многими принтерами

- Компьютерные файлы, содержащие информацию, закодированную в ASCII, легко передаются и обрабатываются различными компьютерами и программами

- Файлы часто называют "ASCII", "текстовыми" или "закодированными" файлами

- Символы ASCII являются доминирующей основой для связи между различными системами и связи с периферийными устройствами

- Файлы, которые не являются ASCII, часто закодированы в "двоичном" формате и обычно могут быть обработаны или поняты только определенными программами

– Компьютеры состоят из нескольких различных аппаратных компонентов

Посмотрите, как работает ПК

Или, возможно, больше, чем вы когда-либо хотели узнать на этом сайте

Центральный процессор (ЦП)

- Центральный процессор является важным компонентом компьютера, поскольку именно он выполняет программы и управляет работой всего оборудования

- В мощных компьютерах может быть несколько процессоров, выполняющих разные задачи, хотя потребуется один или несколько центральных процессоров, управляющих потоком инструкций и данных через вспомогательные процессоры.

- ЦП ПК основаны на серии процессоров или "чипов" от Intel или других производителей (Cyrix)

– В мощных компьютерах используются процессоры Pentium 3 и 4

32-разрядный процессор — до 2 ГГц и 4 ГБ основной памяти

- ЦП Macintosh основаны на чипах серии 68000 от Motorola

����������� В настоящее время Power Mac G5 является самым быстрым персональным компьютером в мире с 64-разрядным процессором, что означает, что он может использовать до 8 гигабайт основной памяти.

Память

- Память хранит ввод и вывод ЦП, а также инструкции, которым следует ЦП

  • Сохраняемый объем измеряется в битах, байтах, кбайтах (K, Kb, 10 3 байт), мегабайтах (Mb, 10 6 байт), гигабайтах (Gb, 10 9 ), терабайтах (Tb, 10 12 )

Спутник системы наблюдения за Землей (EOS) генерирует 17 терабайт данных в день.

– Есть два вида памяти:

- ОСНОВНАЯ ПАМЯТЬ (или внутренняя или первичная память) необходима для работы компьютера, все данные и инструкции должны быть сначала в основной памяти, прежде чем они смогут быть обработаны компьютером

- Самая дорогая память

- В виде микросхем, интегрированных с центральным процессором компьютера

- Самый быстрый доступ - любой байт может быть доступен одинаково быстро (произвольный доступ, поэтому он называется ОЗУ)

- Временно - поскольку данные и инструкции хранятся в оперативной памяти в виде электрических напряжений, перебои в подаче электроэнергии приводят к потере всех данных в основной памяти

- От нескольких сотен мегабайт до 10 гигабайт для обычного ПК до многих террабайт для высокопроизводительных серверов

– ВТОРИЧНАЯ ПАМЯТЬ (или вспомогательная память, или вторичное хранилище) используется для больших, постоянных или полупостоянных файлов

- Программы и данные ГИС обычно требуют очень большого объема памяти

- Хранение данных рассматривается после этого обзора компонентов компьютеров

Периферийные устройства

- Периферийные устройства относятся ко всем другим устройствам, подключенным к компьютерам, которые обрабатывают ввод и вывод

– К устройствам ввода относятся клавиатуры, мыши, трекболы, дигитайзеры и дисководы

.

– К устройствам вывода относятся экраны, принтеры и плоттеры

� Устройства, важные для ГИС, рассматриваются на следующих уроках

Сети

Многие компьютеры связаны между собой для обмена данными и ресурсами (аппаратными и программными средствами)

Архитектура клиент-сервер

Протоколы подключения — проприетарные (например, Microsoft Network, Novell), TCP/IP

WAN (глобальные сети), такие как World Wide Web

LAN (локальные сети) предоставляют определенные ресурсы группе пользователей.

��������� Запускается по местоположению, доступ осуществляется с мобильных устройств – сотовых телефонов, КПК и т. д.

��������� Предоставление контекстной информации: направления, маршруты, условия движения, реклама, достопримечательности, игры и т. д.

Веб-ГИС

������������ Картографический сервер Интернета

������������ Веб-сайты ГИС

Носители информации

– Компьютеры могут использовать несколько различных носителей для хранения информации

- необходим для хранения как необработанных данных, так и программ

- медиа отличаются

- скорость доступа

- постоянное хранение

Неподвижные диски

– Самая дорогая память после основной/внутренней памяти – это фиксированная дисковая память

– Диапазоны от 700–8000 мегабайт для обычного ПК до сотен гигабайт в больших «дисковых фермах» RAID-систем

– Произвольный доступ, но медленнее, чем во внутренней памяти

- Постоянно (т.е. не исчезает при выключении питания), хотя данные можно стереть и изменить

Разборные устройства

- съемные устройства могут быть удалены для хранения или транспортировки, в том числе:

- Съемные жесткие диски, карты памяти, флэш-карты, ZIP-диски (250 Мб) Дискеты 1,44 Мб для ПК - произвольный доступ

- съемные жесткие диски Zip – и Jaz – диск 100 МБ – 1 Гигабайт

- магнитные ленты и кассеты

– от 10 до 100 мегабайт для стандартной ленты

- Доступ последовательный, а не случайный

– Доступ к определенному набору данных на ленте может занять несколько минут, в зависимости от того, где он хранится

- Компакт-диски (CD) с произвольным доступом, 600 Мегабайт на CD Постоянное запоминающее устройство (ПЗУ); Записываемый (WORM) Перезаписываемый (WMRM)

- Цифровой универсальный (видео) диск (DVD) 17 Гбайт с произвольным доступом, скорость доступа близка к CD-ROM

Тома

- том представляет собой одну ленту, компакт-диск, дискету или фиксированный диск, т. е. физическую единицу хранения

Файлы

- файл это логический набор данных - таблица, документ, программа, карта

- на одном томе может храниться много файлов

- файлы получают имена

- правила именования файлов различаются в зависимости от типа системы

– операционная система компьютера отслеживает файлы, хранящиеся на томе, с помощью таблицы, называемой каталогом

- файлы идентифицируются в каталоге по имени, размеру, дате создания и часто типу содержимого

– файлы часто организованы в подкаталоги, чтобы пользователь мог группировать файлы по определенным темам

Программы

- программа представляет собой последовательность связанных инструкций, выполняемых процессором шаг за шагом для выполнения некоторой задачи

- программы определяют, как компьютеры реагируют на ввод, что будет отображаться и выводиться

- существует три типа программ: операционные системы, языковые интерпретаторы и компиляторы и прикладные программы

Операционные системы

- операционная система (ОС) - это программное обеспечение, которое управляет работой компьютера с момента его включения или "загрузки"

- ОС управляет всеми входными и выходными данными на периферийные устройства и с них, а также работой других программ

- позволяет пользователю работать с файлами и управлять ими, не зная конкретно, как данные хранятся и извлекаются

- в многопользовательских системах операционные системы управляют доступом пользователей к процессору и периферийным устройствам и планируют задания

- распространенные операционные системы включают:

� IBM PC и клоны используют MS-Windows или -WindowsNT

– Apple поддерживает собственную операционную систему

- UNIX (и подобные операционные системы, такие как LINUX) — это операционная система для рабочих станций

- сети обычно используют проприетарные операционные системы, разработанные их производителями

- хотя функции, выполняемые операционными системами, схожи, может быть очень сложно переместить файлы или программное обеспечение из одной в другую

- многие программные пакеты работают только под одной операционной системой или имеют существенно разные версии для разных операционных систем

Компиляторы и языки

- поскольку компьютеры работают на электричестве и бинарных операциях, все инструкции, выполняемые компьютерами, должны передаваться ЦП в машинном коде

- однако на этом уровне людям не обязательно взаимодействовать с компьютерами

- программы могут быть написаны на очень специализированных языках, называемых ассемблером, которые позволяют программистам использовать преимущества конкретных возможностей конкретных машин, напрямую обращаясь к основным операциям

- эти языки очень загадочны и очень сложны в использовании

- они также зависят от системы и не могут быть перенесены с одного типа компьютера на другой

- большинство программ создаются с использованием стандартных языков высокого уровня, таких как C, C++, VISUAL BASIC, FORTRAN и т. д., которые распространены в большинстве компьютерных систем, от микро до сетевых

- такие программы называются исходным кодом

- в этих языках обычно используются английские слова и знакомая математическая структура

- компилятор - это программа, предназначенная для преобразования программы, написанной на языке высокого уровня, в машинные инструкции конкретной вычислительной системы или "платформы"

- вывод компилятора C для IBM PC не имеет почти ничего общего с выводом компилятора C для сетевого компьютера

- хотя языки высокого уровня обычно используются при разработке пакетов приложений, таких как ГИС, они обычно компилируются для конкретных платформ перед распространением для широкой публики

- это делается для защиты коммерческих интересов разработчика

Приложения

прикладные программы — это программы, используемые для любых целей, кроме выполнения операций операционной системы или написания других программ

.

- включает ГИС, текстовые процессоры, электронные таблицы, пакеты статистики и графические программы, системы бронирования авиабилетов, системы расчета заработной платы

Ф. РЕДАКТОРЫ И ПРОЦЕССОРЫ

- это пакеты, предназначенные для изменения или редактирования содержимого файлов

- чаще всего используются для редактирования написанного текста или программ

- редактирование и создание файлов числовых данных лучше всего выполнять с помощью специальных редакторов, которые можно найти в пакетах баз данных или электронных таблицах (см. разделы G и H)

- редакторы и текстовые процессоры обычно работают по принципу WYSIWYG ("что видишь, то и получаешь")

- на экране постоянно отображается изображение содержимого файла

- известные текстовые процессоры для IBM PC включают Wordstar, WordPerfect и Microsoft Word

- необходима связь с принтером, чтобы пользователь мог получить "печатную копию" содержимого файла

- редактор является самой важной системой для изучения после операционной системы

- трудно эффективно использовать систему без него

– это пакеты, предназначенные для создания, редактирования, обработки и анализа данных

- чтобы быть пригодными для базы данных, данные должны состоять из записей, которые предоставляют информацию об отдельных случаях, людях, местах, функциях и т. д.

- каждая запись может содержать несколько полей, каждое из которых содержит один элемент информации

- количество и интерпретация полей должны быть постоянными для каждого класса записей

- например. каждая запись в классе "улицы" может содержать поля для имени, длины, поверхности, типа.

- содержимое поля может быть разных типов - числовое или текстовое, фиксированной или переменной длины

- в базе данных может быть несколько классов записей

- напр.база данных бронирования авиабилетов может иметь следующие классы записей и связанных элементов:

пассажиры: имя, телефон, номера рейсов

самолет: тип, регистрационный номер, количество мест

экипаж: имена пилота, второго пилота, бортпроводника, родной город

рейс: номер, время отправления и прибытия, самолет

Функции базы данных

- создание и редактирование записей с использованием настраиваемых экранов

- печать отчетов (обобщение групп записей) с использованием настраиваемых форм отчетов, включая промежуточные итоги и итоги

- выбор записей на основе заданных пользователем правил

- обновление записей на основе новой информации

— связывание записей, например. чтобы определить время прибытия пассажира, связав запись о пассажире с правильной записью рейса

Типы баз данных

- Сетевой, иерархический, реляционный и объектно-ориентированный способы моделирования данных в базе данных

- Хотя используются все четыре модели, реляционная модель оказалась наиболее успешной в ГИС

- подробно обсуждается позже в курсе

- известные системы управления реляционными базами данных (RDBMS) включают dBase, Oracle, Info

– многие из них использовались в определенных ГИС

- многие базы данных используют один и тот же язык SQL (стандартный язык запросов) для формулирования запросов

- это системы, которые позволяют пользователю работать с числовыми данными в табличной форме

- итоги столбцов и строк, проценты и т. д. автоматически обновляются при изменении элементов данных

- Lotus 1-2-3 — известная электронная таблица для IBM PC

- предлагает ряд типов статистического анализа

- данные в основном числовые

- может включать:

- функции базы данных, такие как редактирование, печать отчетов

- возможности для графического вывода, особенно графиков, но многие также создают карты

- - S-plus – общедоступный статистический пакет, другие распространенные пакеты – SAS, SPSS, BMD

- доступно для широкого спектра операционных систем

- некоторые из них были "перенесены" (переписаны) на IBM PC

– многие другие пакеты были разработаны специально для среды ПК

Maguire, D.J., 1989. Компьютеры в географии, John Wiley and Sons, Inc., Нью-Йорк.

Текущие обзоры и сравнения различного аппаратного и программного обеспечения часто публикуются, особенно для среды ПК, в таких журналах, как Byte и PC Magazine.

Многочисленные тексты доступны на различных уровнях сложности для операционных систем, редакторов, компиляторов и обычных прикладных программ.

<р>1. Сравните потребности в хранении данных (а) данных, которые будут передаваться спутниками EOS 1990-х годов, которые генерируют около 1 терабайта в день, (б) файлов TIGER уличных сетей Бюро переписи населения США, которые составляют около 10 ГБ и обновляется каждые 10 лет, а также (c) база данных объемом 100 МБ, созданная для использования в разовом исследовании воздействия на окружающую среду.

<р>2. «Ожидания пользователей в отношении объемов данных растут не менее быстро, чем емкость доступных устройств хранения». Обсудить.

<р>3. Как вы думаете, почему компьютерная индустрия не смогла договориться об общей операционной системе? или единственный исходный язык?

<р>4. Описать функциональные различия между базами данных, электронными таблицами и статистическими пакетами. Что было бы полезнее для (а) исследований на факультете университета, (б) ведения административного учета в малом бизнесе, (в) планирования личного бюджета?

Описание в основном взято у профессора Виджая Рагунатана. В этом задании вы будете использовать свои знания об очередях с приоритетами, стеках и деревьях для разработки программы сжатия файлов и программы распаковки файлов (аналогично zip и unzip). Вы будете основывать свои утилиты на широко используемом алгоритмическом методе кодирования Хаффмана, который используется при сжатии JPEG, а также при сжатии аудио MP3.

Кодировка ASCII

Давайте теперь рассмотрим простой пример кодировки символов ASCII. Используя кодировку ASCII (8 бит на символ), 13-символьная строка "go go gophers" требует 13 * 8 = 104 бита. В таблице ниже показано, как работает кодирование.

Данная строка будет записана как следующий поток битов (пробелы не будут записаны, только 0 и 1)

01100111 01101111 00100000 01100111 01101111 00100000 01100111 01101111 01110000 01101000 01100101 01110010 01110011

Обратите внимание, что мы предполагаем, что для каждого байта у нас есть старший бит слева и младший бит справа для этого PE/PA. На самом деле это не имеет значения, за исключением того, что программы сжатия и распаковки должны следовать одному и тому же порядку битов.

От кодирования ASCII к кодированию Хаффмана

Далее посмотрим, как мы можем использовать меньше битов, используя более простую схему кодирования.Поскольку в "гоу-гоферс" всего 8 разных символов, для кодирования 8 разных символов можно использовать только 3 бита. Мы могли бы, например, использовать кодировку, показанную в таблице ниже (имейте в виду, что возможны и другие 3-битные кодировки).

3-битное двоичное значение

Теперь строка " go go gophers " будет закодирована как: 000 001 111 000 001 111 000 001 010 011 100 101 110. Как вы можете видеть, используя три бита на символ вместо восьми битов на символ, который использует ASCII , строка "go gophers" использует в общей сложности 39 бит вместо 104 бит.

Однако даже в этой улучшенной схеме кодирования мы использовали одинаковое количество битов для представления каждого символа, независимо от того, как часто этот символ появляется в нашей строке. Можно сэкономить еще больше битов, если мы будем использовать менее трех битов для кодирования таких часто встречающихся символов, как g, o и пробел, и более трех битов для кодирования таких символов, как e, h, p, r и s, которые встречаются реже. "иди, суслики". Это основная идея кодирования Хаффмана: использовать меньше битов для символов, которые встречаются чаще. Мы увидим, как это делается с помощью древовидной структуры данных, в которой символы хранятся в виде конечных узлов, а пути от корня к листу обеспечивают битовую последовательность, используемую для кодирования символов.

На пути к кодовому дереву

При использовании двоичного дерева для кодирования все символы хранятся в листьях дерева. Левое ребро пронумеровано 0, а правое ребро пронумеровано 1. Код для любого символа/конечного узла получается путем следования пути от корня к листу и объединения 0 и 1. Конкретная структура дерева определяет кодирование любого конечного узла с использованием описанного соглашения о ребрах 0/1. Например, дерево ниже справа дает кодировку, показанную слева.

Двоичный код


При использовании этой кодировки "go gophers" кодируется (опять же, в потоке битов пробелы не появляются) как: 00 01 101 00 01 101 00 01 1110 1101 1100 1111 100 . Всего это 37 бит, что на два бита меньше, чем в улучшенной кодировке, в которой каждый из 8 символов имеет 3-битную кодировку! Биты сохраняются за счет кодирования часто встречающихся символов, таких как 'g' и 'o', с меньшим количеством битов (здесь два бита), чем символы, которые встречаются реже, такие как 'p', 'h', 'e' и 'r'.< /p>

Чтобы декодировать данный поток, который был закодирован данным деревом, начните с корня дерева и следуйте левой ветви, если следующий бит в потоке равен 0, и правой ветви, если следующий бит в потоке равно 1. Когда вы достигнете листа, напишите символ, хранящийся на листе, и начните снова с вершины дерева. Поток битов 10011101101110011111100 выдает справа-налево-налево до буквы ' s ', за которой следует (снова начиная с корня) справа-направо-направо-налево до буквы ' p ', за которым следует правый-правый-левый-правый до буквы 'h'. Продолжая таким образом, мы получим декодированную строку « сфера ».

Коды префиксов

Когда все символы хранятся в листьях, а каждый внутренний (неконечный) узел имеет двух дочерних элементов, кодирование, основанное на описанном выше соглашении 0/1, удовлетворяет очень важному свойству, называемому свойство префикса в котором говорится, что никакая кодировка битовой последовательности символа не является префиксом кодировки битовой последовательности любого другого символа. Это позволяет декодировать битовый поток с использованием дерева кодирования, следуя путям от корня к листу. Дерево, показанное выше для "go gophers", удовлетворяет этому свойству префикса и является оптимальным деревом. Есть и другие деревья, использующие 37 бит; например, вы можете просто поменять местами любые одноуровневые узлы и получить другую кодировку, которая использует то же количество битов. Далее рассмотрим алгоритм построения такого оптимального дерева. Этот алгоритм называется кодированием Хаффмана и был изобретен Дэвидом А. Хаффманом в 1952 году, когда он был доктором философии. студент Массачусетского технологического института.

Кодирование по методу Хаффмана

В предыдущем разделе мы видели примеры того, как поток битов может быть сгенерирован из кодирования. Мы также видели, как дерево можно использовать для декодирования потока битов. Здесь мы обсудим, как построить дерево с помощью алгоритма Хаффмана.

Мы предполагаем, что с каждым символом связан вес, равный тому, сколько раз этот символ встречается в файле. Например, в строке "go gophers" символы 'g' и 'o' имеют вес 3, пробел имеет вес 2, а остальные символы имеют вес 1. При сжатии файла нам нужно сначала прочитать файл и вычислить эти веса. Предположим, что все веса символов рассчитаны. Алгоритм Хаффмана предполагает, что мы строим одно дерево из группы (или леса) деревьев. Изначально все деревья имеют один узел, содержащий символ и его вес.Итеративно новое дерево формируется путем выбора двух деревьев и создания нового дерева, дочерние узлы которого являются корнями двух деревьев. Вес нового дерева равен сумме весов двух поддеревьев. Это уменьшает количество деревьев на одно в каждой итерации. Процесс повторяется до тех пор, пока не останется только одно дерево. Алгоритм следующий:

  1. Начните с леса деревьев. Все деревья имеют только один узел, а вес дерева равен весу символа в узле. Наиболее часто встречающиеся символы имеют наибольший вес. Символы, которые встречаются реже всего, имеют наименьший вес.

Выберите два дерева с наименьшим весом; назовите эти деревья T1 и T2. Создайте новое дерево, корень которого имеет вес, равный сумме весов T1 + T2, и левое поддерево которого равно T1 > и правым поддеревом которого является T2.

  1. Единственное дерево, оставшееся после предыдущего шага, является оптимальным деревом кодирования.

В качестве примера мы будем использовать строку "go gophers". Изначально у нас есть лес, показанный ниже. Узлы показаны с весом, который представляет собой количество раз, когда символ узла встречается в данной входной строке/файле.



Выбор первых двух (минимальных) узлов в очереди приоритетов дает другое дерево с весом 2, как показано ниже. Теперь в лесу деревьев есть шесть деревьев, которые в конечном итоге построят дерево кодирования.


Снова мы должны выбрать первые два (минимальных) узла в очереди приоритетов. Наименьшим весом является 'e'-узел/дерево с весом, равным 1. Есть три дерева с весом 2; выбранный соответствует символу ASCII из-за того, как мы упорядочиваем узлы в очереди приоритетов. Новое дерево имеет вес 3 и будет помещено последним в очередь приоритетов в соответствии с нашей стратегией упорядочения.


Теперь есть два дерева с весом, равным 2. Они объединены в новое дерево, вес которого равен 4. Осталось четыре дерева, одно с весом 4 и три с весом 3.


Первые два минимальных (вес 3) дерева в очереди с приоритетом объединяются в дерево, вес которого равен 6. Осталось три дерева.


Минимальные деревья имеют веса 3 и 4; они объединены в дерево с весом 7.


Наконец, последние два дерева объединяются в окончательное дерево, вес которого равен 13, сумме двух весов 6 и 7. Это дерево — это дерево, которое мы использовали для иллюстрации кода Хаффмана выше. Обратите внимание, что вы можете легко получить альтернативное оптимальное дерево, используя другую стратегию упорядочивания для упорядочивания деревьев с одинаковыми весами. В этом случае битовые шаблоны для каждого символа различаются, но общее количество битов, используемых для кодирования "вперед, суслики", одинаково.


Теперь мы покажем другое дерево для оптимального сжатия строки "улицы - это каменные звезды, а не ". Чтобы закодировать «улицы», у нас будут следующие биты: 1110001111011000111101010011110 .

Еще один пример дерева/таблицы Хаффмана


Важно отметить, что вы не можете использовать дерево, построенное для строки «иди, иди, суслики», для декодирования битовых потоков, полученных при кодировании «улицы, каменные звезды, нет», так как кодирование выполняется с использованием другого дерева.

Реализация/программирование кода Хаффмана

В этом разделе мы рассмотрим основные этапы программирования при реализации кодирования Хаффмана. Реализация состоит из двух частей: программы сжатия и программы распаковки. Будем считать, что это отдельные программы, но на самом деле у них много общих функций. В этом наборе упражнений/задания по программированию вы будете иметь дело в основном с декомпрессией. Однако, чтобы выполнить распаковку, мы должны понимать сжатие.

Программа сжатия

Для сжатия файла (последовательности символов) вам нужна таблица битовых кодировок, т. е. таблица, содержащая последовательность битов, используемых для кодирования каждого символа. Эта таблица построена из дерева кодирования с использованием путей от корня к листу для создания последовательности битов, которая кодирует каждый символ.

Сжатый файл получается с помощью следующих шагов верхнего уровня. Эти этапы будут далее преобразованы в подэтапы, и в конечном итоге вы создадите программу, основанную на этих идеях и подэтапах.

<р>1. Постройте дерево кодирования Хаффмана на основе количества вхождений каждого символа ASCII в файле. Создайте таблицу кодов Хаффмана для всех символов ASCII, встречающихся в файле.

<р>2. Прочитайте сжимаемый файл (обычный файл) и обработайте по одному символу за раз. Для обработки каждого символа найдите битовую последовательность, которая кодирует символ, используя таблицу, построенную на предыдущем шаге, и запишите эту битовую последовательность в сжатый файл.

Чтобы сжать строку "улицы - это камни, звезды - это не ", например, мы читаем из строки по одному символу за раз. Код для 's' — 111, мы пока не можем писать в файл. Читаем следующий символ 't', код которого равен 00. Опять же, мы не можем записать в выходной файл, потому что общее количество битов всего 5. Теперь мы читаем следующий символ 'r', код которого равен 011. Программа сжатия теперь может печатать символ битовой комбинации 11100011 в выходной файл.

Еще раз напомним, что мы используем такой порядок битов в байте, при котором старший бит находится слева, а младший бит справа.

Что произойдет, если вы дойдете до конца файла, а у вас не накопится 8 бит для печати. Все, что вам нужно сделать, это дополнить накопленные биты достаточным количеством 0 и напечатать их в выходной файл.

Мы покажем вам информацию заголовка, которую написанная мной программа сжатия предоставляет в начале сжатого файла, чтобы программа распаковки могла правильно декодировать сжатый файл.

Информация в заголовке

Вы должны сохранить некоторую исходную информацию в сжатом файле, которая будет использоваться программой распаковки/распаковки. По сути, вы должны сохранить дерево, которое используется для сжатия исходного файла. Это связано с тем, что программе декомпрессии требуется точно такое же дерево для декодирования данных. Мы будем называть топологию информацией заголовка. В начале сжатого файла есть три целых числа без знака:

· Общее количество символов в сжатом файле в виде 4-байтового целого числа без знака.

· Общее количество символов, в которых хранится информация заголовка, т. е. топология дерева кодирования Хаффмана, в виде 4-байтового целого числа без знака.

· Общее количество символов в исходном несжатом файле в виде 4-байтового целого числа без знака.

После трех целых чисел без знака мы сохраняем информацию заголовка или топологию дерева кодирования Хаффмана, а затем следует кодирование исходного текста с использованием кодов Хаффмана. Мы описали кодирование исходного текста в предыдущих разделах. Теперь мы сосредоточимся на том, как хранится топология дерева кодирования Хаффмана.

Чтобы сохранить дерево в начале файла, мы используем обход в обратном порядке, записывая каждый посещенный узел. Когда вы сталкиваетесь с конечным узлом, вы пишете 1, за которым следует символ ASCII конечного узла. Когда вы сталкиваетесь с нелистовым узлом, вы пишете 0 . Чтобы указать конец дерева кодирования Хаффмана, мы пишем еще один 0 .

Возьмем строку "go gophers", заголовок которой содержит "1g1o01s1 01e1h01p1r00000", за которым следует закодированный текст. Обход дерева кодирования Хаффмана в обратном порядке дает нам «1g1o01s1 01e1h01p1r0000». Еще один "0" отделяет топологию от закодированного текста.

Для строки "улицы – это камни, звезды – не ", информация заголовка – "1t1a1r001n1o01 01e1s0000", за которой следует закодированный текст.

В этих двух примерах мы используем символы 0 и 1, чтобы различать нелистовые и конечные узлы (и 0, чтобы указать конец топологии). Так как в каждом из двух примеров восемь конечных узлов, есть восемь 1, семь 0 для нелистовых узлов и еще один 0 для обозначения того, что мы достигли конца топологии. Этот подход использовал в общей сложности 24 байта.

Информацию заголовка можно сделать более экономичной, если использовать биты 0 и 1 для различения нелистовых и листовых узлов, а также для обозначения конца топологии. В этих двух примерах всего будет 10 байтов (8 байтов для листовых узлов и 2 байта для всех 0 и 1). Проблема здесь в том, что и программам сжатия, и программам распаковки придется обрабатывать биты, а не символы.Например, в побитовом подходе первые 16 бит (или первые 2 байта) информации заголовка для кодирования строки «улицы — это каменные звезды, а не» равны 10111010 01011000 (обратите внимание, что пространство в битовом потоке равно введено для большей ясности). Кодировка ASCII для ' t ' охватывает два байта, 7 битов в первом байте и 1 бит во втором байте. Второй старший бит во втором байте равен 1, что указывает на то, что следующие 8 битов являются символом ASCII, из которых 6 старших битов символа 'a' содержатся в 6 младших битах второго байта. .

В побитовом представлении дерева кодирования Хаффмана последний байт не может содержать 8 бит. В этом случае мы снова дополняем его 0 битами. Рассмотрим случай, когда во входном файле используются девять различных символов ASCII. Количество битов, необходимых для представления дерева кодирования Хаффмана, составляет 9×8 + 9×2 = 90 бит, что может быть представлено 12 байтами. Другими словами, последний байт должен содержать только два полезных бита. За 12 байтами следует закодированный текст.

Программа декомпрессии или дегазации

При наличии сжатого файла, содержащего информацию заголовка, за которым следует битовый поток, соответствующий кодировке исходного файла, программа распаковки должна выполнить следующие задачи:

<р>1. Постройте дерево кодирования Хаффмана на основе информации заголовка. Вам, вероятно, понадобится второе целое число без знака, хранящееся в начале сжатого файла, чтобы упростить построение.

<р>2. Побитовое чтение из сжатого файла (начиная с места после информации заголовка). Используйте бит чтения для обхода дерева кодирования Хаффмана (0 слева и 1 справа), начиная с корневого узла. Когда программа достигает конечного узла, напечатайте соответствующий символ ASCII в выходной файл. Начинается с корневого узла дерева кодирования Хаффмана, когда считывается следующий бит. Программа завершается, когда количество декодированных символов совпадает с количеством символов, сохраненным как третье целое число без знака в начале сжатого файла.

Чтобы построить дерево кодирования Хаффмана из информации заголовка, мы используем стек. Когда считывается 1 (бит или символ в зависимости от того, имеем ли мы дело с битовым или символьным представлением), мы читаем следующий байт и помещаем соответствующий символ ASCII в стек. Когда читается 0 (бит или символ), если стек содержит только один элемент, мы построили все дерево кодирования Хаффмана. В противном случае в стеке должно быть более одного элемента. Мы создаем новый узел и извлекаем два верхних элемента из стека. Мы делаем первый элемент из стека правым дочерним элементом нового узла, а второй элемент вне стека — левым дочерним элементом нового узла. После этого мы помещаем только что созданный узел в стек.

Список включает библиотечную терминологию, а также некоторую компьютерную и интернет-терминологию. Нажмите на букву той части алфавита, к которой вы хотите перейти. Для невыделенных букв слова не определены.

А

abridged Сокращенная версия книги или другого документа.

аннотация Резюме статьи, книги или другой письменной публикации. Некоторые базы данных содержат рефераты статей. Аннотация обычно не превышает 200 слов.

Акроним Слово, образованное из начальных букв ряда слов. Например, ALA означает Американскую библиотечную ассоциацию.

альманах Ежегодное издание, содержащее полезные факты и статистические данные. Обычно содержит информацию о разных странах.

аннотированная библиография Библиография, в которой за каждой цитатой следует аннотация, содержащая краткое описательное и/или оценочное резюме, синопсис или реферат.

ежегодный Ежегодный выпуск.

антология Коллекция опубликованных произведений одного или нескольких авторов, иногда организованная в хронологическом порядке или по определенной теме. (например, Антология женской литературы).

ПРИЛОЖЕНИЕ (вычислительное) — автономная программа или часть программного обеспечения, предназначенная для выполнения определенной цели; приложение, часто загружаемое пользователем на мобильное устройство.

архивы Записи или документы, имеющие историческую ценность, или место, где хранятся такие записи и документы.

ASCII — американский стандартный код для обмена информацией. Стандарт, позволяющий использовать компьютерные файлы и текст, например сообщения электронной почты, во многих различных системах. Обычно считается, что это символы, набранные с клавиатуры, такие как буквы, цифры и стандартные знаки препинания английского языка. Программы обработки текста обычно могут сохранять файлы в формате ASCII или двоичном формате (по умолчанию).

аудиовизуальные материалы Библиотечные материалы в непечатной форме, такие как аудиокассеты, видеокассеты, компакт-диски, DVD-диски и диафильмы.

Б

библиографическая ссылка Информация, идентифицирующая книгу, журнальную статью или электронный источник.Информация о книге обычно включает автора, название, издательство и дату. Цитата статьи включает автора, название статьи, название периодического издания, том, страницы и дату. Электронное цитирование включает URL. Некоторые базы данных содержат только цитаты из книг и статей. См. стиль APA и стиль MLA для примеров стилей цитирования. Цитата может относиться к ссылке в конце научной работы или статьи либо к ссылке на статью или книгу в онлайн-базе данных.

библиография Список книг, статей или других источников (интервью, фильмы) по определенной теме. Библиографии могут быть найдены в конце книг или статей или могут быть отдельными публикациями.

binary Формат или тип файла, содержащий непечатаемый текст, отличный от ASCII. Файл обработки текстов, например, написанный и сохраненный в WordPerfect или MSWord, является двоичным файлом, и его следует просматривать в приложении обработки текстов. При передаче двоичных файлов с помощью приложения, такого как FTP, укажите, что файл должен передаваться в двоичном формате.

обзор книги Оценка книги, обычно публикуемая в периодическом издании или газете.

логическая логика Использование операторов И, ИЛИ, НЕ для объединения условий поиска. (см. КЛЮЧЕВЫЕ СЛОВА/ПОИСК КЛЮЧЕВЫХ СЛОВ). И означает, что оба слова, которые вы вводите, должны быть включены в поиск, например, «RED и RIDING». ИЛИ означает, что может быть включено либо одно слово, либо другое слово, либо оба слова. "ВЕРХОВАЯ ЕЗДА или КАПЮШОН". Не означает исключить из поиска слово "КРАСНЫЙ, а не ВОЛК".

браузер Программа, которая обычно запускается на компьютере и позволяет просматривать файлы. Часто используется в сочетании со Всемирной паутиной, такой как Internet Explorer или Netscape, которые позволяют получить доступ к интернет-серверам и просматривать веб-страницы.

С

номер вызова Группа букв и цифр, присвоенная каждому элементу, которая используется для упорядочивания материалов в библиотеке и описания их местоположения. Классификация Библиотеки Конгресса (телефонный номер LC) используется для материалов в библиотеке Гринли; пример: HR 270 B86 1994. В некоторых публичных библиотеках используется десятичная система счисления Дьюи вместо LC.

чувствительность к регистру Использование заглавных букв имеет значение при поиске с учетом регистра. Заглавные буквы (верхний регистр) извлекаются только в верхнем регистре. Большинство инструментов поиска не чувствительны к регистру или реагируют только на начальные заглавные буквы, как в именах собственных. Обычно рекомендуется использовать все строчные буквы (без заглавных), потому что строчные буквы всегда будут извлекать также и прописные.

CD-ROM — постоянное запоминающее устройство для компакт-дисков Метод хранения информации или данных. Данные наносятся лазером на компакт-диск.

оплата или получение Процесс заимствования материалов для использования за пределами библиотеки. Это делается на кассе. Требуется удостоверение личности студента/факультета/сотрудника.

абонементный стол Также часто называемый циркулярным, место для проверки библиотечных материалов.

распространяемые материалы Любые библиотечные материалы, которые можно получить из библиотеки. (Некоторые материалы не распространяются, например, периодические издания и справочные материалы).

Ссылка То же, что библиографическая ссылка

клиент или клиентское программное обеспечение Компьютерная программа или программное обеспечение, которое запрашивает информацию с сервера. Программное обеспечение, отвечающее за взаимодействие с пользователем, например за отображение данных и прием ввода с клавиатуры или мыши. Например, одним из способов просмотра веб-страниц является использование клиентской программы netscape на микрокомпьютере, netscape взаимодействует с сервером всемирной паутины.

курсовые резервы Материалы, которые преподаватели отложили для чтения учащимися в классе. Резервными материалами могут быть книги (включая учебники), статьи или DVD. Эти предметы можно взять напрокат на короткий срок и использовать только в библиотеке.

междисциплинарные Связи, которые существуют между понятиями, словарным запасом и навыками из разных предметных областей (включая искусство), особенно те связи, которые ведут к более глубокому пониманию.

кумулятивный указатель Указатель, в котором несколько ранее опубликованных указателей объединены в одну книгу. Обычно охватывает несколько месяцев или лет.

текущее периодическое издание Самые последние выпуски журнала или журнала, часто изданные в течение последнего года.

Д

база данных Компьютерная программа, которая хранит информацию, такую ​​как журнальные статьи или цитаты из книг, таким образом, чтобы вы могли искать определенные типы информации. База данных индексирует информацию, то есть организует и описывает ее. См. указатель.

поиск в базе данных Поиск в базе данных выполняется с использованием компьютерной системы для перечисления цитат из журнальных статей или полного текста по теме.

диссертация Публикация, в которой сообщается об оригинальном исследовании, необходимое для получения степени доктора философии. степень. Некоторые базы данных индексируют диссертации. Библиотека не собирает диссертации.

скачать Чтобы переместить копию файла из многопользовательской системы или сервера на ваш компьютер.

Е

Электронная почта или электронная почта Служба, которая позволяет сообщению передаваться в электронном виде на другой компьютер.

ethernet Спецификация сети, разработанная Digital Equipment Corporation, Intel и Xerox, которая теоретически позволяет передавать данные со скоростью 10 мегабит (миллионов бит) в секунду.

Ф

Часто задаваемые вопросы — часто задаваемые вопросы В Интернете перечислены часто задаваемые вопросы, содержащие вопросы и ответы на часто задаваемые вопросы. Их можно найти на веб-страницах, FTP-сайтах, новостях Usenet или других электронных дискуссионных группах.

поле. В базе данных записи разделены на отдельные части, называемые полями. Поле в записи базы данных сообщает вам один вид информации, например, имя автора, название журнала или тему статьи. В большинстве баз данных вы можете точно настроить свой поиск, предписав базе данных искать информацию, просматривая определенное поле. Большинство полей сокращены. Например, вы можете выполнить поиск по слову «ледники» в журнале «Естественная история» в некоторых базах данных, введя в поиске «ледники и jn=природная история».

Ограничение поля Требование, чтобы ключевое слово или фраза появлялись в определенном поле извлекаемых документов. Чаще всего используется для ограничения полем «Заголовок», чтобы найти документы с одним или несколькими ключевыми словами в заголовке.

FTP — протокол передачи файлов FTP позволяет передавать один или несколько файлов с одного компьютера в Интернете на другой. Файлы могут содержать документы или программы и могут быть текстом ASCII или содержать ДВОИЧНЫЕ данные.

Полнотекстовые статьи, которые полностью доступны в Интернете, либо в онлайн-базе данных, либо в Интернете, называются «полнотекстовыми статьями». Обычно содержание полнотекстовой статьи совпадает с содержанием печатной версии этой статьи, если печатная версия существует. «Полнотекстовая база данных» — это база данных, в которой некоторые или все проиндексированные статьи доступны в полнотекстовом формате.

Г

GIF – формат графического обмена Формат файла, содержащего графику или изображение. Файлы, использующие этот формат, обычно имеют суффикс .jpg как часть своего имени. Его часто произносят с мягким звуком "г", "джифф" или с твердым звуком "г".

Правительственные документы Все материалы, опубликованные государственными органами: федеральными, государственными, местными или иностранными. Материалы могут быть в форме отчетов, законов, статистики, журналов, информационных бюллетеней, микроформ или других материалов.

Н

Удержание Удержание гарантирует, что когда книга будет возвращена в отдел распространения, она будет сохранена для вас.

автоматы Группа предметов (книг, журналов, журналов), включенных в библиотеку. Когда в базе данных есть информация о фондах, это означает, что она может сообщить вам, какие библиотеки владеют перечисленными элементами.

домашняя страница Документ, к которому вы обращаетесь из браузера World Wide Web, такого как netscape, мозаика или lynx. Обычно он обозначает главный документ в серии связанных документов.

HTML — язык гипертекстовой разметки Язык, используемый для создания веб-страниц. HTML сообщает браузеру, как отображать документ. Документ для Всемирной паутины содержит HTML-теги или инструкции для изменения внешнего вида документа.

гипертекст Гипертекстовый документ содержит ссылки или указатели на другие документы. Вы переходите по ссылке на другой гипертекстовый документ и можете вернуться к первому документу.

Я

указатель Список предметов, имен, должностей и т. д., который поможет вам найти информацию. В периодическом указателе перечислены статьи по темам или авторам. Книжный указатель — это список в конце книги, в котором указаны номера страниц, на которых можно найти имена и темы в книге.

Межбиблиотечный абонемент — ILL Способ получить материалы, принадлежащие другим библиотекам. Вы можете отправить запрос ILL напрямую через библиотечную базу данных FirstSearch или заполнить форму запроса. Формы доступны в справочном бюро.

интернет/Интернет Интернет (в нижнем регистре) — это термин, означающий группу подключенных сетей. Заглавная буква I означает всемирную компьютерную сеть, основанную на протоколе TCP/IP, и все ресурсы, подключенные к ней. Интернет содержит, помимо прочего, всемирную паутину, сайты gopher и ftp.

IP-адрес, номер интернет-протокола, каждый ресурс, подключенный к Интернету, имеет уникальный интернет-номер, который его идентифицирует, например 129.24.8.1

ISP – Интернет-провайдер Интернет-провайдер предоставляет доступ к Интернет-услугам. AOL - это интернет-провайдер. Коммерческие интернет-провайдеры взимают с пользователей фиксированную ежемесячную плату.

Ж

журнал Публикация, содержащая научную информацию, обычно написанная учеными, исследователями или экспертами в предметной области и не предназначенная для широкой публики. См. журнал и научный журнал.

Jpeg — формат файла, содержащего графику или изображение. Файлы, использующие этот формат, обычно имеют суффикс .jpg как часть своего имени.

К

поиск по ключевому слову/ключевому слову Наиболее значимые слова в теме, названии книги или статьи и т. д. Ключевые слова используются в качестве терминов при поиске в базах данных.

Л

Тематические заголовки Библиотеки Конгресса Специальный словарь или предметные заголовки, которые можно использовать для поиска информации в карточном каталоге или онлайн-каталоге. Самые последние каталоги предметных рубрик LC находятся на столах напротив справочного бюро.

ссылка Когда документ использует HTML и публикуется в WWW, ссылки представляют собой слова или места, на которые вы можете «щелкнуть» в документе, чтобы перейти к другим разделам документа или к другим документам в WWW. Ссылки обычно выделяются синим цветом и отображаются в виде подчеркнутого текста, хотя изображения также могут быть ссылками. Указатель мыши превращается в значок "рука", когда он находится над ссылкой.

listserv Listserv упрощает работу с электронными списками рассылки. Эти списки рассылки могут быть ориентированы на любой тип обсуждения, например, один список может быть посвящен обсуждению определенной темы, или список может обеспечивать электронное обсуждение конкретной группы или комитета. Члены рассылки обычно подписываются, отправляя сообщение электронной почты на специальное имя учетной записи. Корреспонденция генерируется путем отправки почты на адрес рассылки, а затем перераспределяется в виде сообщения электронной почты всем членам списка.

М

журнал Журнал содержит новости или статьи на различные темы, написанные для широкой аудитории. Time и People Weekly — два популярных журнала. Журналы обычно выходят ежемесячно.

рукопись Рукописное или машинописное сочинение, а не печатное. В некоторых базах данных рукописи перечислены под аббревиатурой «mss».

микроформы Микрофиши (карточки размером 4 на 6 дюймов) и микрофильмы (рулон пленки); печатные материалы, размер которых был уменьшен фотографическими методами для экономии места.

модем Аббревиатура модулятора-демодулятора. Модем — это устройство, которое позволяет микрокомпьютеру или терминалу связываться по телефонной линии с другим компьютером или с компьютерной сетью. Для его использования может потребоваться программное обеспечение.

монография Книга.

О

онлайн-ресурсы Источники, такие как базы данных и веб-сайты, доступные через Интернет. Библиотека покупает подписки на различные онлайн-ресурсы, которые позволяют пользователям библиотеки искать информацию в базах данных.

онлайн-поиск Использование онлайн-ресурса, например базы данных, для поиска цитат, рефератов или полнотекстовых статей по теме.

OPAC – общедоступный онлайн-каталог Электронная система карточного каталога или компьютер, к которому вы подключаетесь при поиске библиотечных ресурсов, например книг.

OV Относится к книгам большого размера. В нашем онлайн-каталоге вы увидите буквы «OV» перед некоторыми телефонными номерами. Крупногабаритные книги слишком велики, чтобы поместиться на полках обычных библиотек. Они откладываются на полку после окончания номера вызова Z в стопках внизу.

П

страница Во Всемирной паутине страница относится к веб-документу, независимо от его размера.

рецензируемый журнал См. "научный журнал".

периодическое издание Элемент, который публикуется на регулярной основе, например журналы, журналы и газеты.

Поиск фраз Позволяет вам в базе данных искать определенные слова в определенном порядке. Полезно для имен собственных, названий компаний и названий государственных ведомств. Большинство поисковых фраз должны заключаться в кавычки, например "Министерство юстиции".

POP — протокол почтового отделения POP — это протокол для доставки электронной почты.

Протокол Протокол – это ожидаемый набор команд или действий. Например, когда вы разговариваете с кем-то, обычно ожидается, что вы поприветствуете его. Для компьютеров протокол — это набор инструкций, которые ожидает часть программного или аппаратного обеспечения. Если инструкции даны неправильно, желаемая задача не будет выполнена.

Вопрос

запрос Запрос означает вопрос, но часто используется для обозначения запроса, который вы вводите в базе данных или поисковой системе.

Р

запись В базе данных информация об одном элементе хранится в виде «записи». Например, вся информация, такая как название, автор и издатель книги, называется «записью» книги. Записи состоят из нескольких полей или отдельных частей.

рецензируемый журнал См. "научный журнал".

reserve То же, что и резерв курса. Другие материалы также могут храниться в резерве.

ранжирование результатов Порядок, в котором отображаются результаты поиска. Каждый инструмент поиска использует свой уникальный алгоритм.

С

научный журнал Журнал, который рецензируется, то есть эксперты в научной области составляют редакционный совет, который рассматривает все статьи до того, как они будут приняты к публикации. Научные журналы содержат статьи, написанные исследователями, занимающимися оригинальной работой в предметной области. Эти статьи содержат библиографические ссылки на другие статьи и источники. Большинство научных журналов посвящены определенной теме. Например, The Journal of Neurology и Renaissance Quarterly – это два научных журнала.

поиск Использование базы данных или каталога для поиска информации.Команды или слова, которые вы вводите, называются «поиском».

Поисковая система Чтобы найти документы в Интернете, вам необходимо использовать поисковую систему. Поисковые системы представляют собой очень большие базы данных, содержащие информацию о веб-страницах. Поисковые системы автоматически обновляются специальными программами, называемыми «роботами» или «пауками», которые ищут в WWW новый контент, а затем сообщают о своих выводах в базу данных. Существует множество различных поисковых систем, которые вы можете использовать для поиска. Одними из самых популярных являются Google, Yahoo и Bing. Если вам нужна помощь в использовании поисковой системы, обратитесь к библиотекарю.

Serial Публикация, которая предназначена для продолжения на неопределенный срок. Сюда входят периодические издания, такие как журналы, журналы, газеты и книги, такие как альманахи и ежегодники, которые выходят каждый год.

стеки Книжные полки, содержащие основное книжное собрание библиотеки. Они расположены на нижнем уровне библиотеки Гринли и открыты для просмотра.

тематический заголовок Определенное слово или фраза, используемая для поиска книги или статьи по определенной теме в каталоге или указателе периодических изданий. Тематические заголовки обычно представляют собой широкие категории. В базе данных индексаторы присваивают статьям предметные заголовки, чтобы их можно было упорядочить по темам.

Т

TCP/IP — протокол управления передачей/Интернет-протокол Основной метод связи между приложениями в Интернете.

telnet Программа, используемая для подключения к компьютерной системе по сети. Как правило, telnet предоставляет пользователю "терминальный" сеанс для выполнения работы, например чтения электронной почты.

Тезаурус Относится к книге и функции базы данных. В книге перечислены альтернативные термины со значениями, близкими к тому, который вы ищете. В базе данных тезаурус использует термины, которые вы выбираете для поиска, чтобы привести вас к другим терминам, которые вы, возможно, не рассматривали (связанные термины). В то время как тезаурус книжного типа предоставляет вам более широкий выбор слов, цель тезауруса базы данных состоит в том, чтобы «направить» ваш поиск на уникальный официальный язык «предметных рубрик» базы данных. Например, тезаурус базы данных может предложить вам использовать слово «автомобили» вместо слов автомобиль, автомобили, автомобили, транспортные средства и т. д.

усечение При поиске возможность ввести первую часть ключевого слова, вставить символ (обычно *) и принять любые варианты написания или окончания слова, начиная с появления символа и далее. (Например, librar* извлекает библиотеку, библиотеки, библиотекарь, библиотекари и т. д.)

Н

Unix Unix – это операционная система с открытым исходным кодом, которую можно найти в Интернете. Unix — это многопользовательская система, то есть к ней одновременно могут получить доступ многие люди.

В

volume Количество выпусков периодического издания, обычно за год.

В

Windows Windows – это операционная система, которая обычно работает на персональном компьютере и использует графический интерфейс пользователя (ГИП).

Читайте также:

Единица Эквивалент
1 килобайт (КБ) 1024 байта
1 мегабайт (МБ)
1 гигабайт (ГБ) 1 073 741 824 байта
1 терабайт (ТБ) ) 1 099 511 627 776 байт
1 петабайт (ПБ) 1 125 899 906 842 624 байт