Какой код используется для кодирования всей информации в компьютерном тесте

Обновлено: 03.07.2024

Как мы все знаем, компьютеры не понимают английский алфавит, числа, кроме 0 и 1, или текстовые символы. Мы используем кодирование для их преобразования. Итак, кодирование — это метод или процесс преобразования последовательности символов, т. е. букв, цифр, знаков препинания и символов, в специальный или уникальный формат для передачи или хранения в компьютерах. Данные представлены в компьютерах с использованием схем кодирования ASCII, UTF8, UTF32, ISCII и Unicode. Компьютеры могут обрабатывать все типы данных, включая числа, текст, фотографии, аудио- и видеофайлы. Например, 65 представляется как A, потому что всем символам, символам, числам присваивается некоторый уникальный код стандартными схемами кодирования. Некоторые из часто используемых схем кодирования описаны ниже:

  1. Непечатаемый, системные коды от 0 до 31.
  2. Меньший ASCII, от 32 до 127.
  3. Высший ASCII, от 128 до 255.
<р>2. ISCII: ISCII (индийский код письма для обмена информацией) — это аббревиатура индийского алфавитного кода для обмена информацией. ISCII — это метод кодирования, который можно использовать для кодирования широкого спектра индийских языков, как письменных, так и устных. Чтобы упростить транслитерацию между несколькими системами письма, ISCII использует единый механизм кодирования.

  1. Здесь представлено подавляющее большинство индийских языков.
  2. Набор символов прост и понятен.
  3. Между языками можно легко транслитерировать.
  1. Требуется специальная клавиатура с символьными клавишами ISCII.
  2. Поскольку Unicode был создан позже, а Unicode включал в себя символы ISCII, ISCII устарел. ISCII (код индийской письменности для обмена информацией) – это код индийской письменности для обмена информацией.
  3. ISCII – это метод кодирования, с помощью которого можно кодировать широкий спектр индийских языков, как письменных, так и устных. Чтобы упростить транслитерацию между несколькими системами письма, ISCII использует единый механизм кодирования.
  1. Юникод позволяет создавать единый программный продукт или веб-сайт для нескольких платформ, языков и стран (без переделки), что приводит к значительной экономии средств по сравнению со старыми наборами символов.
  2. Данные Unicode можно использовать без повреждения данных в различных системах.
  3. Юникод – это универсальный метод кодирования, который можно использовать для кодирования любого языка или буквы независимо от устройства, операционной системы или программного обеспечения.
  4. Юникод – это стандарт кодировки символов, который позволяет выполнять преобразование между несколькими системами кодировки символов. Поскольку Юникод является расширенным набором всех других основных систем кодировки символов, вы можете преобразовать одну схему кодировки в Юникод, а затем из Юникода в другую схему кодировки.
  5. Наиболее широко используемой кодировкой является Юникод.
  6. Применимые версии стандарта ISO/IEC 10646, определяющего кодировку символов универсального набора символов, полностью совместимы и синхронизированы с версиями стандарта Unicode. Или мы можем сказать, что он включает 96 447 кодов символов, которых достаточно для декодирования любого символа, присутствующего в мире.
<р>5. UTF-32: UTF-32 известен как 32-битный формат преобразования Unicode. Это кодировка фиксированной длины, которая кодирует кодовые точки Unicode, используя 32 бита на код. Он использует 4 байта на символ, и мы можем подсчитать количество символов в строке UTF-32, просто подсчитав байты. Основное преимущество использования UTF-32 заключается в том, что кодовые точки Unicode могут быть проиндексированы напрямую (хотя буквы в целом, такие как «кластеры графем» или некоторые эмодзи, не могут быть проиндексированы напрямую, поэтому определение отображаемой ширины строки является более сложным) . Операцией с постоянным временем является нахождение N-й кодовой точки в последовательности кодовых точек. С другой стороны, код переменной длины требует последовательного доступа для нахождения N-й кодовой точки в строке. В результате UTF-32 является простой заменой кода ASCII, который проверяет каждую проблему в строке, используя числа, увеличивающиеся на единицу.

Раздел 404 Закона Сарбейнса-Оксли (SOX) требует, чтобы все публичные компании установили внутренний контроль и процедуры.

Закон о защите конфиденциальности детей в Интернете от 1998 года (COPPA) – это федеральный закон, который налагает особые требования на операторов доменов .

План North American Electric Reliability Corporation по защите критически важной инфраструктуры (NERC CIP) представляет собой набор стандартов.

Стандарт безопасности данных платежных приложений (PA-DSS) – это набор требований, призванных помочь поставщикам программного обеспечения в разработке безопасных .

Взаимная аутентификация, также называемая двусторонней аутентификацией, представляет собой процесс или технологию, в которой оба объекта обмениваются данными .

Экранированная подсеть или брандмауэр с тройным подключением относится к сетевой архитектуре, в которой один брандмауэр используется с тремя сетями .

Медицинская транскрипция (МТ) – это ручная обработка голосовых сообщений, продиктованных врачами и другими медицинскими работниками.

Электронное отделение интенсивной терапии (eICU) — это форма или модель телемедицины, в которой используются самые современные технологии.

Защищенная медицинская информация (PHI), также называемая личной медицинской информацией, представляет собой демографическую информацию, медицинскую .

Снижение рисков – это стратегия подготовки к угрозам, с которыми сталкивается бизнес, и уменьшения их последствий.

Отказоустойчивая технология — это способность компьютерной системы, электронной системы или сети обеспечивать бесперебойное обслуживание.

Синхронная репликация — это процесс копирования данных по сети хранения, локальной или глобальной сети, поэтому .

Коэффициент усиления записи (WAF) – это числовое значение, представляющее объем данных, передаваемых контроллером твердотельного накопителя (SSD) .

API облачного хранилища — это интерфейс прикладного программирования, который соединяет локальное приложение с облачным хранилищем.

Интерфейс управления облачными данными (CDMI) – это международный стандарт, определяющий функциональный интерфейс, используемый приложениями.

Целевая аудитория: авторы контента, пользователи и все, кто не знает, что такое кодировка символов, и хочет получить краткую информацию о том, как она на них влияет.

Вопрос

Что такое кодировка символов и зачем мне это?

Ответить

Во-первых, какое мне дело?

Если вы используете какой-либо другой текст, кроме самого простого английского текста, люди могут не прочитать созданный вами контент, пока вы не скажете, какую кодировку символов вы использовали.

Например, вы можете сделать так, чтобы текст выглядел так:

но на самом деле это может выглядеть так:

Отсутствие информации о кодировке символов не только ухудшает читаемость отображаемого текста, но и может означать, что ваши данные не могут быть найдены поисковой системой или надежно обработаны машинами рядом других способов.

Так что же такое кодировка символов?

Слова и предложения в тексте создаются из файлов . Примеры символов включают латинскую букву á, китайскую иероглифику 請 или иероглиф деванагари ह .

Возможно, вы не сможете увидеть некоторые символы на этой странице, потому что у вас нет необходимых шрифтов. Если вы нажмете на то место, где вы ожидали увидеть символ, вы перейдете к графической версии. Эта страница закодирована в UTF-8.

Символы, необходимые для определенной цели, группируются в (также называемые ). (Для однозначного обращения к символам каждый символ связан с числом, называемым .)

Символы хранятся в компьютере как один или несколько .

В принципе, вы можете визуализировать это, предположив, что все символы хранятся в компьютерах с использованием специального кода, подобного шифрам, используемым в шпионаже. A предоставляет ключ для разблокировки (т.е. взлома) кода. Это набор сопоставлений между байтами в компьютере и символами в наборе символов. Без ключа данные выглядят как мусор.

Этот вводящий в заблуждение термин часто используется для обозначения того, что на самом деле является кодировкой символов. Вы должны знать об этом использовании, но по возможности придерживайтесь термина кодировки символов.

Таким образом, когда вы вводите текст с помощью клавиатуры или каким-либо другим способом, кодировка символов сопоставляет выбранные вами символы с определенными байтами в памяти компьютера, а затем для отображения текста считывает байты обратно в символы.

К сожалению, существует множество различных наборов символов и кодировок, т.е. множество различных способов отображения между байтами, кодовыми точками и символами. В разделе «Дополнительная информация» для тех, кто интересуется, немного больше подробностей.

Однако в большинстве случаев вам не нужно знать подробности. Вам просто нужно быть уверенным, что вы прислушаетесь к советам в разделе Как это на меня повлияет? ниже.

Как в это вписываются шрифты?

A — это набор определений глифов, т.е. определения фигур, используемых для отображения символов.

После того как ваш браузер или приложение определит, с какими символами он имеет дело, он будет искать в шрифте глифы, которые можно использовать для отображения или печати этих символов. (Конечно, если информация о кодировке была неверной, она будет искать глифы для неправильных символов.)

Заданный шрифт обычно охватывает один набор символов или, в случае большого набора символов, такого как Unicode, только подмножество всех символов в наборе. Если в вашем шрифте нет глифа для определенного символа, некоторые браузеры или программные приложения будут искать отсутствующие глифы в других шрифтах в вашей системе (это будет означать, что глиф будет отличаться от окружающего текста, например, примечание о выкупе). ). В противном случае вы обычно увидите квадратную рамку, вопросительный знак или какой-либо другой символ. Например:

Как это влияет на меня?

В настоящее время как автор или разработчик контента вы всегда должны выбирать кодировку символов UTF-8 для своего контента или данных. Эта кодировка Unicode является хорошим выбором, потому что вы можете использовать кодировку одного символа для обработки любого символа, который вам может понадобиться. Это сильно упрощает дело. Использование Unicode во всей вашей системе также избавляет от необходимости отслеживать и преобразовывать различные кодировки символов.

Авторам контента необходимо выяснить, как объявить кодировку символов, используемую для формата документа, с которым они работают.

Обратите внимание, что простое объявление другой кодировки на вашей странице не изменит байты; вам также нужно сохранить текст в этой кодировке.

Разработчикам необходимо убедиться, что различные части системы могут взаимодействовать друг с другом, понимать, какие кодировки символов используются, и поддерживать все необходимые кодировки и символы. (В идеале вы должны использовать кодировку UTF-8 везде и избавитесь от этой проблемы.)

По приведенным ниже ссылкам можно найти дополнительную информацию по этим темам.

Дополнительная информация

В этом разделе содержится небольшая дополнительная информация о сопоставлении между байтами, кодовыми точками и символами для тех, кому это интересно. Не стесняйтесь просто перейти к разделу «Дополнительная литература».

Обратите внимание, что числа кодовых точек обычно выражаются в шестнадцатеричной системе счисления, т.е. основание 16. Например, 233 в шестнадцатеричной форме равно E9. Значения кодовой точки Unicode обычно записываются в форме U+00E9.

В наборе кодированных символов ISO 8859-1 (также известном как Latin1) значение десятичного кода для буквы é равно 233. Однако в ISO 8859-5 та же самая кодовая точка представляет кириллический символ щ .

Эти наборы символов содержат менее 256 символов и напрямую сопоставляют кодовые точки со значениями байтов, поэтому кодовая точка со значением 233 представлена ​​одним байтом со значением 233. Обратите внимание, что только контекст определяет, будет ли этот байт представляет либо é, либо sch .

Есть и другие способы обработки символов из ряда сценариев. Например, с помощью набора символов Unicode вы можете представлять оба символа в одном наборе. На самом деле Unicode содержит в одном наборе, вероятно, все символы, которые вам когда-либо понадобятся. В то время как буква é по-прежнему представлена ​​кодовой точкой 233, кириллический символ щ теперь имеет кодовую точку 1097.

В наши дни байты обычно состоят из 8 бит. Существует только 2 8 (т.е. 256) уникальных способов объединения 8 битов.

С другой стороны, 1097 — слишком большое число, чтобы его можно было представить одним байтом*. Итак, если вы используете кодировку символов для текста Unicode, называемую UTF-8, щ будет представлена ​​двумя байтами. Однако значение кодовой точки получается не просто из значения двух соединенных вместе байтов — требуется более сложное декодирование.

Другие символы Юникода соответствуют одному, трем или четырем байтам в кодировке UTF-8.

Кроме того, обратите внимание, что буква é также представлена ​​двумя байтами в UTF-8, а не одним байтом, который используется в ISO 8859-1. (Только символы ASCII кодируются одним байтом в UTF-8.)

UTF-8 — это наиболее широко используемый способ представления текста Unicode на веб-страницах, и вы всегда должны использовать UTF-8 при создании своих веб-страниц и баз данных. Но, в принципе, UTF-8 — это лишь один из возможных способов кодировки символов Юникода. Другими словами, одна кодовая точка в наборе символов Unicode может фактически отображаться в различные последовательности байтов, в зависимости от того, какая кодировка использовалась для документа. Кодовые точки Unicode могут быть сопоставлены с байтами с использованием любой из кодировок, называемых UTF-8, UTF-16 или UTF-32. Символ деванагари क с кодовой точкой 2325 (что равно 915 в шестнадцатеричной записи) будет представлен двумя байтами при использовании кодировки UTF-16 (09 15), тремя байтами при использовании UTF-8 (E0 A4 95) или четырьмя байтами. байт с кодировкой UTF-32 (00 00 09 15).

Могут быть дополнительные сложности помимо описанных в этом разделе (например, порядок байтов и escape-последовательности), но описанные здесь подробности показывают, почему важно, чтобы приложение, с которым вы работаете, знало, какая кодировка символов подходит для ваших данных. , и знает, как обращаться с этой кодировкой.

Дополнительная литература

Начинаете? Введение в наборы символов и кодировки — указывает на другие документы W3C, связанные с наборами символов и кодировками

Учебное пособие, Работа с кодировками символов в HTML и CSS. Советы по выбору кодировки, ее объявлению и другим темам, связанным с HTML и CSS.

Настройка кодировки в веб-приложениях для разработки — как заставить ваш редактор сохранять в другой кодировке список сред редактирования.

Однако сегодня, работая с сетевыми протоколами и сетевым программированием, вы столкнетесь с множеством схем кодирования данных и символов.

В этом руководстве мы рассмотрим основные схемы кодирования, используемые на компьютерах, а во второй части руководства мы рассмотрим, как данные передаются по сети.

Символы, целые числа, числа с плавающей точкой и т. д.

При хранении и передаче данных вам необходимо будет представлять следующие типы данных:

  • Символы и цифры, например A и 1
  • Длинные (32 бита) и короткие (16 бит) целые числа со знаком и без знака
  • Одинарное и двойное число с плавающей запятой
  • Логическое значение, т. е. True и False

Так как же компьютер запоминает букву А или цифру 1?

Как компьютер запоминает число вроде 60101? или 62.0101?

Как передать букву А и т. д. на другой компьютер по сети?

Компьютеры и кодировка символов

Чтобы сохранить текст в виде двоичных данных, необходимо указать кодировку для этого текста.

Компьютерные системы могут использовать различные схемы кодирования символов.

Пока данные остаются на компьютере, совершенно неважно, как они закодированы.

Однако для передачи данных между системами необходимо использовать стандартную схему кодирования.

В 1968 году ASCII (Американский стандартный код для обмена информацией) был принят в качестве стандарта кодирования текста для обмена данными.

ASCII

ASCII – это американский стандарт, разработанный для кодирования английских символов и знаков препинания, которые использовались на пишущих машинках и телетайпах того времени (1960-е годы).

ASCII использует 8 бит, хотя на самом деле используется только 7 бит.

Поскольку кодировка ASCII была разработана во время эксплуатации устройств телетайпа, она также содержит управляющие коды, предназначенные для управления устройством телетайпа.

В таблице ниже представлены сводные данные о распределении кодов.

Таблица ASCII – сводка кодов

Расширения ASCII

Поскольку ASCII не может кодировать такие символы, как знак фунта £ или распространенные символы немецкого и других европейских языков, были разработаны различные расширения.

Эти расширения сохранили набор символов ASCII и использовали неиспользуемую часть адресного пространства и управляющие коды для дополнительных символов.

Наиболее распространенными являются Windows 1252 и Latin-1 (ISO-8859).

Windows 1252 и 7-битная кодировка ASCII были наиболее широко используемыми схемами кодирования до 2008 года, когда UTF-8 стал наиболее распространенным.

ISO-8859-1,ISO-8859-15, Latin-1

ISO-8859 — это 8-битная кодировка символов, которая расширяет 7-битную схему кодирования ASCII и используется для кодирования большинства европейских языков. Подробнее см. вики.

ISO-8859-1, также известный как Latin-1, является наиболее широко используемым, поскольку его можно использовать для большинства распространенных европейских языков, например немецкого, итальянского, испанского, французского и т. д.

Она очень похожа на схему кодирования Windows-1252, но не идентична, см. Сравнение символов в Windows-1252, ISO-8859-1, ISO-8859-15

Юникод

В связи с необходимостью кодирования символов иностранных языков и других графических символов был разработан набор символов Unicode и схемы кодирования.

Самые распространенные схемы кодирования:

UTF-8 – это наиболее часто используемая схема кодирования, используемая в современных компьютерных системах и компьютерных сетях.

Это схема кодирования переменной ширины, разработанная для полной обратной совместимости с ASCII. Он использует от 1 до 4 байт. – вики

Наборы символов и схемы кодирования

Разница между ними не всегда ясна, и термины, как правило, используются взаимозаменяемо.

Набор символов — это список символов, а схема кодирования — это то, как они представлены в двоичном формате.

Это лучше всего видно с Unicode.

Схемы кодирования UTF-8, UTF-16 и UTF-32 используют набор символов Unicode, но кодируют символы по-разному.

ASCII – это набор символов и схема кодирования.

Знак порядка байтов (BOM)

Знак порядка байтов (BOM) — это символ Unicode, U+FEFF, который появляется как магическое число в начале текстового потока и может сигнализировать программе, потребляющей текст, о нескольких вещах: –Wiki

  • Порядок байтов или порядок следования байтов в текстовом потоке;
  • Тот факт, что кодировка текстового потока — Unicode, с высокой степенью достоверности;
  • Какой Unicode кодирует текстовый поток.

Спецификация различается для текста в кодировке UTF-8, UTF-16 и UTF-32

Следующая таблица, взятая из Wiki, показывает это.

bom-table- пример

Спецификации и текстовые редакторы

Как правило, большинство редакторов правильно обрабатывают спецификацию, и она не отображается.

Программное обеспечение Microsoft, такое как Блокнот, добавляет спецификацию при сохранении данных в кодировке UTF-8 и не может интерпретировать текст без спецификации, если он не является чистым ASCII.

Пример спецификации

Ниже приведен вывод простой программы на Python, которая отображает содержимое файла, содержащего символы TEST (4 символа), сохраненные в виде ASCII, UTF-8, UTF-16-BE и UTF-16-LE

BOM-example

Распространенные вопросы и ответы

В. Как узнать, какую кодировку символов использует файл?

A- Обычно это не так, но некоторые текстовые редакторы, такие как notepad++, отображают кодировку. Если вы получили файл, закодированный с помощью кодировки, отличной от ожидаемой, вы можете получить сообщение об ошибке при попытке его чтения.

В. Мой файл в формате ASCII, но он нормально декодируется с помощью декодера UTF-8. Почему?

A- Потому что UTF-8 обратно совместим с ASCII.

Целые числа и числа с плавающей запятой — Big и Little Endian

Примечание. Поскольку в кодировках UTF-16 и UTF-32 используются 2-байтовые или 4-байтовые целые числа, к кодированию текста с их использованием применяется следующее

Количество байтов, выделенных для целого числа или числа с плавающей запятой, зависит от системы.

Пункт Tutorials описывает это для языка программирования C, и я буду использовать его для иллюстрации

Если мы возьмем короткое целое как 2 байта, а длинное целое как 4 байта.

Поскольку они используют несколько байтов, возникает несколько вопросов:

  • Какой байт представляет старшую часть числа?
  • При сохранении в памяти, какой байт сохраняется первым
  • При отправке по сети какой байт отправляется первым.

Окончание байтов относится к последовательному порядку, в котором байты упорядочиваются в более крупные числовые значения при сохранении в памяти или при передаче по цифровым каналам связи.
Окончание байтов представляет интерес в информатике, потому что два конфликтующих и несовместимых формата широко используются: слова могут быть представлены в формате с прямым порядком байтов или прямым порядком байтов, в зависимости от того, упорядочены ли биты, байты или другие компоненты от большого конец (самый значащий бит) или маленький конец (наименьший значащий бит).
В формате с обратным порядком байтов всякий раз, когда адресуется память или отправляются/сохраняются слова побайтно, старший значащий байт — байт, содержащий старший значащий бит — сохраняется сначала (имеет младший адрес) или отправляется первым, затем следующие байты сохраняются или отправляются в порядке убывания значимости, причем младший байт — тот, который содержит младший значащий бит — сохраняется последним (имеет самый высокий адрес) или отправляется последним.

Вики

int- Пример кодирования байтов

На приведенном ниже рисунке с использованием python показано целое число 16, представленное в виде 4 байтов, с использованием порядка байтов с прямым и обратным порядком байтов.

Сетевой порядок байтов и системный порядок байтов

Сетевой порядок байтов – это порядок расположения байтов при отправке данных по сети. ( TCP/IP обычно имеет формат Big Endian ).

Это означает, что старший байт отправляется первым.

Системный порядок байтов или порядок байтов хоста — это способ размещения байтов при сохранении в памяти хост-системы.

Память — это система обработки информации; поэтому мы часто сравниваем его с компьютером. Память – это набор процессов, используемых для кодирования, хранения и извлечения информации в течение различных периодов времени.

На диаграмме показаны три поля, расположенные в ряд слева направо, соответственно под названиями

Рисунок 1. Кодирование включает ввод информации в систему памяти. Хранение – это сохранение закодированной информации. Извлечение, или извлечение информации из памяти и обратно в осознание, — это третья функция.

Кодирование

Мы получаем информацию в наш мозг посредством процесса, называемого кодированием, который представляет собой ввод информации в систему памяти. Как только мы получаем сенсорную информацию из окружающей среды, наш мозг маркирует или кодирует ее. Мы организуем информацию с другой подобной информацией и связываем новые понятия с существующими понятиями. Кодирование информации происходит посредством автоматической обработки и обработки, требующей усилий. Если кто-то спросит вас, что вы ели сегодня на обед, скорее всего, вы легко вспомните эту информацию. Это называется автоматической обработкой или кодированием таких деталей, как время, пространство, частота и значение слов. Автоматическая обработка обычно выполняется без какого-либо сознательного осознания. Вспомнить, когда вы в последний раз готовились к тесту, — еще один пример автоматической обработки. Но как насчет фактического тестового материала, который вы изучали?Вероятно, вам потребовалось много работы и внимания, чтобы закодировать эту информацию. Это называется трудоемкой обработкой (рис. 2).

На фотографии изображен человек за рулем автомобиля.

Рис. 2. Когда вы впервые осваиваете новые навыки, например вождение автомобиля, вам приходится прилагать усилия и внимание, чтобы закодировать информацию о том, как завести машину, как тормозить, как вести себя в повороте и т. д. Как только вы научитесь водить машину, вы сможете автоматически кодировать дополнительную информацию об этом навыке. (кредит: Роберт Коуз-Бейкер)

Каковы наиболее эффективные способы обеспечить надежное кодирование важных воспоминаний? Даже простое предложение легче вспомнить, когда оно осмысленно (Андерсон, 1984). Прочитайте следующие предложения (Bransford & McCarrell, 1974), затем отведите взгляд и сосчитайте в обратном порядке от 30 по три до нуля, а затем попробуйте записать предложения (не заглядывая на эту страницу!).

  1. Заметки были кислыми, потому что швы разошлись.
  2. Путешествие не было задержано из-за того, что бутылка разбилась.
  3. Стог сена был важен, потому что ткань порвалась.

Насколько хорошо вы справились? Сами по себе утверждения, которые вы записали, скорее всего, сбивали вас с толку и вам было трудно их вспомнить. Теперь попробуйте написать их снова, используя следующие подсказки: волынка, крещение корабля и парашютист. Затем сосчитайте в обратном порядке от 40 до четырех, а затем проверьте себя, насколько хорошо вы запомнили предложения на этот раз. Вы можете видеть, что предложения теперь намного лучше запоминаются, потому что каждое из предложений было помещено в контекст. Материал гораздо лучше кодируется, когда вы придаете ему смысл.

Существует три типа кодирования. Кодирование слов и их значения известно как семантическое кодирование. Впервые это было продемонстрировано Уильямом Боусфилдом (1935) в эксперименте, в котором он просил людей запоминать слова. 60 слов были фактически разделены на 4 категории значения, хотя участники не знали об этом, потому что слова были представлены случайным образом. Когда их просили запомнить слова, они, как правило, вспоминали их по категориям, показывая, что обращали внимание на значения слов по мере их заучивания.

Визуальное кодирование — это кодирование изображений, а акустическое кодирование — это кодирование звуков, в частности слов. Чтобы увидеть, как работает визуальное кодирование, прочтите этот список слов: автомобиль, уровень, собака, правда, книга, ценность. Если бы вас позже попросили вспомнить слова из этого списка, как вы думаете, какие из них вы, скорее всего, запомнили бы? Вероятно, вам будет легче вспоминать слова автомобиль, собака и книга, и труднее вспоминать слова уровень, правда, и значение. Почему это? Потому что вы можете вспоминать образы (ментальные картинки) легче, чем одни только слова. Когда вы читаете слова автомобиль, собака и книга, вы создаете образы этих вещей в своем уме. Это конкретные, образные слова. С другой стороны, абстрактные слова, такие как уровень, истина и значение, малоизобразительны. Образные слова кодируются как визуально, так и семантически (Paivio, 1986), что укрепляет память.

Теперь обратимся к акустическому кодированию. Вы едете в своей машине и по радио звучит песня, которую вы не слышали как минимум 10 лет, но вы подпеваете, вспоминая каждое слово. В Соединенных Штатах дети часто изучают алфавит с помощью песен и узнают количество дней в каждом месяце с помощью стишков: « Тридцать дней в сентябре / апреле, июне и ноябре; / У всех остальных тридцать один, / За исключением февраля, с двадцатью восемью ясными днями, / И двадцать девять в каждом високосном году». Эти уроки легко запомнить благодаря акустическому кодированию. Мы кодируем звуки, которые издают слова. Это одна из причин, почему большая часть того, чему мы учим маленьких детей, осуществляется с помощью песен, рифм и ритма.

Какой из трех типов кодирования, по вашему мнению, лучше всего запоминает вербальную информацию? Несколько лет назад психологи Фергус Крейк и Эндел Талвинг (1975) провели серию экспериментов, чтобы выяснить это. Участникам были даны слова вместе с вопросами о них. Вопросы требовали от участников обработки слов на одном из трех уровней. Вопросы визуальной обработки включали такие вещи, как вопросы о шрифте букв. Вопросы акустической обработки спрашивали участников о звучании или рифмовке слов, а вопросы семантической обработки спрашивали участников о значении слов. После того, как участникам были представлены слова и вопросы, им было предложено неожиданное задание на припоминание или распознавание.

Слова, закодированные семантически, запоминались лучше, чем слова, закодированные визуально или акустически. Семантическое кодирование предполагает более глубокий уровень обработки, чем более поверхностное визуальное или акустическое кодирование. Крейк и Талвинг пришли к выводу, что лучше всего мы обрабатываем вербальную информацию посредством семантического кодирования, особенно если мы применяем так называемый эффект самореференции. Эффект самореференции — это склонность человека лучше запоминать информацию, относящуюся к нему самому, по сравнению с материалом, имеющим меньшее личное значение (Rogers, Kuiper & Kirker, 1977). Может ли семантическое кодирование быть полезным для вас, когда вы пытаетесь запомнить концепции этого модуля?

Перекодирование

Процесс кодирования является избирательным, и в сложных ситуациях замечаются и кодируются относительно немногие из многих возможных деталей. Процесс кодирования всегда включает в себя перекодирование, то есть извлечение информации из той формы, в которой она была доставлена ​​нам, а затем преобразование ее таким образом, чтобы мы могли понять ее смысл. Например, вы можете попытаться запомнить цвета радуги, используя аббревиатуру ROY G BIV (красный, оранжевый, желтый, зеленый, синий, индиго, фиолетовый). Процесс перекодирования цветов в название может помочь нам запомнить. Однако перекодирование также может привести к ошибкам: когда мы случайно добавляем информацию во время кодирования, помните этот новый материал, как если бы он был частью реального опыта (как обсуждается ниже).

Изображение старого велосипеда с большим передним колесом и цифрой 6, написанной красным текстом внутри колеса.

Хотя это требует больше усилий, использование изображений и ассоциаций может улучшить процесс перекодирования. [Изображение: Лео Рейнольдс]

Психологи изучили множество стратегий перекодирования, которые можно использовать во время учебы для улучшения запоминания. Во-первых, исследования советуют во время обучения думать о значении событий (Craik & Lockhart, 1972) и пытаться связать новые события с уже известной нам информацией. Это помогает нам формировать ассоциации, которые мы можем использовать для извлечения информации позже. Во-вторых, воображение событий также делает их более запоминающимися; создание ярких образов из информации (даже вербальной) может значительно улучшить последующее припоминание (Bower & Reitman, 1972). Создание образов является частью техники, которую Саймон Рейнхард использует для запоминания огромного количества цифр, но мы все можем использовать изображения для более эффективного кодирования информации. Основная концепция хороших стратегий кодирования заключается в том, чтобы формировать отличительные воспоминания (те, которые выделяются) и формировать связи или ассоциации между воспоминаниями, чтобы облегчить последующее извлечение (Hunt & McDaniel, 1993). Использование стратегий обучения, подобных описанным здесь, является сложной задачей, но усилия стоят того, чтобы получить преимущества расширенного обучения и удержания.

Ранее мы подчеркивали, что кодирование избирательно: люди не могут кодировать всю информацию, с которой они сталкиваются. Однако перекодирование может добавить информацию, которую даже не видели и не слышали на начальном этапе кодирования. Некоторые процессы перекодирования, такие как формирование ассоциаций между воспоминаниями, могут происходить без нашего ведома. Это одна из причин, по которой люди иногда могут помнить события, которых на самом деле не было, потому что в процессе записи к ним добавляются детали. Одним из распространенных способов вызвать ложные воспоминания в лаборатории является использование метода списка слов (Deese, 1959; Roediger & McDermott, 1995). Участники услышат список из 15 слов, таких как дверь, стекло, панель, оттенок, карниз, подоконник, дом, открыть, занавес, рама, вид, ветерок, створка, экран и жалюзи<. /em> Позже участникам предлагается тест, в котором им показывают список слов и просят выбрать те, которые они слышали ранее. Этот второй список содержит некоторые слова из первого списка (например, дверь, стекло, рама) и некоторые слова, не входящие в список (например, рука, телефон, бутылка). В этом примере одним из слов в тесте является окно, которое, что важно, не появляется в первом списке, но связано с другими словами в этом списке. Во время тестирования испытуемые достаточно точно произносили изучаемые слова (дверь и т. д.), узнавая их в 72 % случаев. Однако, когда окно было в тесте, они ошибочно распознавали его как находящееся в списке в 84% случаев (Stadler, Roediger, & McDermott, 1999). То же самое произошло и со многими другими списками, которые использовали авторы. Это явление называется эффектом DRM (от Deese-Roediger-McDermott). Одним из объяснений таких результатов является то, что, когда учащиеся слушали элементы в списке, слова вызывали у них мысли об окне, хотя окно никогда не было представлено. Таким образом, кажется, что люди кодируют события, которые на самом деле не являются частью их опыта.

Поскольку люди творческие, мы всегда выходим за рамки информации, которую нам дают: мы автоматически создаем ассоциации и делаем на их основе выводы о том, что происходит. Но, как и в случае с путаницей словесных ассоциаций, описанной выше, иногда мы создаем ложные воспоминания из наших выводов — вспоминая сами выводы, как если бы они были реальным опытом. Чтобы проиллюстрировать это, Брюэр (1977) давал людям для запоминания предложения, предназначенные для получения прагматических выводов. Выводы, как правило, относятся к случаям, когда что-то не указано явно, но мы все же можем угадать нераскрытое намерение. Например, если ваша подруга сказала вам, что не хочет идти куда-нибудь поесть, вы можете сделать вывод, что у нее нет денег, чтобы пойти куда-нибудь, или что она слишком устала. Что касается прагматичных выводов, вы, скорее всего, сделаете один конкретный вывод. Рассмотрим заявление Брюэр (1977), сделанное ее участникам: «Чемпионка по карате ударилась о шлакоблок». Услышав или увидев это предложение, участники, прошедшие тест на память, как правило, запоминали утверждение как «Чемпион по карате сломал шлакоблок». Это запомненное утверждение не обязательно является логическим выводом (т. е. вполне разумно, что чемпион по карате может ударить шлакоблок, не сломав его). Тем не менее, прагматический вывод из такого предложения состоит в том, что блок, скорее всего, был нарушен. Участники запомнили этот вывод, сделанный ими при прослушивании предложения, вместо фактических слов, которые были в предложении (см. также McDermott & Chan, 2006).

Кодирование — первоначальная регистрация информации — имеет важное значение в процессе обучения и запоминания. Если событие не закодировано каким-либо образом, оно не будет успешно запомнено позже. Однако только потому, что событие закодировано (даже если оно закодировано хорошо), нет гарантии, что его вспомнят позже.

Цели обучения

<р>1. Сравните и сопоставьте два способа кодирования информации.

Информация кодируется посредством автоматической или принудительной обработки. Автоматическая обработка относится ко всей информации, которая поступает в долговременную память без сознательных усилий. Сюда входят такие вещи, как время, пространство и частота — например, ваша способность вспомнить, что вы ели сегодня на завтрак, или тот факт, что вы помните, что дважды на этой неделе встречали своего лучшего друга в супермаркете. Усиленная обработка относится к кодированию информации посредством сознательного внимания и усилий. Материал, который вы изучаете для теста, требует тщательной обработки.

Глоссарий

автоматическая обработка: кодирование информационных деталей, таких как время, пространство, частота и значение слов

Читайте также: