Какие действия может выполнять компьютер с данными

Обновлено: 21.11.2024


9 . Обработка данных

В предыдущих главах мы встречались с некоторыми полезными инструментами для конкретных вычислительных задач. Например, в главе 7 мы узнали о SQL для извлечения данных из реляционной базы данных.

Поскольку набор данных хранится в реляционной базе данных, теперь мы можем написать фрагмент кода SQL для извлечения данных из этого набора данных. Но что, если мы хотим извлечь данные из базы данных в определенное время суток? Что, если мы хотим повторять эту задачу каждый день в течение года? SQL не имеет представления о том, когда выполнять задачу.

В главе 5 мы узнали о преимуществах языка XML для хранения данных, но также узнали, что это очень подробный формат. Мы могли бы разработать структуру XML-документа, но действительно ли мы были бы готовы писать большие объемы XML вручную? Что мы хотим сделать, так это заставить компьютер написать файл XML-кода для нас.

Для выполнения подобных задач нам нужен язык программирования . С помощью языка программирования мы сможем сказать компьютеру выполнить задачу в определенное время или повторить задачу определенное количество раз. Мы сможем создавать файлы информации и сможем выполнять вычисления со значениями данных.

Цель этой главы — изучить и перечислить некоторые задачи, которые позволяет нам выполнять язык программирования. Как и в предыдущих темах, важно знать, какие задачи действительно возможны, а также смотреть на технические детали выполнения каждой задачи.

Как и следовало ожидать, язык программирования позволит нам сделать гораздо больше, чем могут сделать конкретные языки, такие как HTML, XML и SQL, но это будет стоить денег, поскольку нам нужно будет изучить несколько более сложных концепций. . Однако потенциальная выгода безгранична. В этой главе мы по-настоящему реализуем обещание взять под контроль нашу вычислительную среду.

Другая важная цель этой главы — представить конкретный язык программирования, чтобы мы могли выполнять задачи на практике.

Существует множество языков программирования, но в этой главе мы будем использовать язык R, поскольку он относительно прост в изучении и особенно хорошо подходит для работы с данными.

Итак, что мы можем сделать с языком программирования?

Чтобы ответить на этот вопрос, снова будет полезно сравнить и сопоставить язык программирования с более конкретными языками, с которыми мы уже встречались, и с тем, что мы можем с ними сделать.

SQL позволяет нам взаимодействовать с системами баз данных; мы можем попросить программное обеспечение базы данных извлечь определенные данные из таблиц базы данных. С помощью HTML мы можем общаться с веб-браузерами; мы можем указать программному обеспечению браузера отображать определенный контент на веб-странице. Работа с XML немного сложнее, потому что мы, по сути, обращаемся к любой программной системе, которая может быть заинтересована в наших данных. Однако мы можем сказать только «вот данные».

Язык программирования является более общим и мощным, чем любой из них, и основная причина этого заключается в том, что язык программирования позволяет нам взаимодействовать не только с другими программными системами, но и с компьютерным оборудованием.

Чтобы понять значение этого, нам нужно иметь очень общее представление об основных компонентах компьютерного оборудования и о том, что мы можем с ними делать. На рис. 9.1 показана простая диаграмма основных компонентов стандартной вычислительной среды, а краткое описание каждого компонента приведено ниже.

Рисунок 9.1: Схема, иллюстрирующая основные компоненты стандартной вычислительной среды.

Центральный процессор (CPU) — это часть оборудования, которая может выполнять вычисления или обрабатывать наши данные. Он способен выполнять лишь небольшой набор операций — основные арифметические операции, а также возможность сравнения значений и возможность перемещать значения между ячейками в памяти компьютера — но выполняет эти задачи исключительно быстро. Сложные задачи выполняются путем объединения множества простых операций в ЦП.

ЦП также имеет доступ к часам для определения времени.

Возможность взаимодействовать с ЦП означает, что мы можем выполнять сколь угодно сложные вычисления. Это начинается с простых вещей, таких как определение минимума, максимума и среднего значения для числовых значений, но включает в себя сложные методы анализа данных, и на самом деле нет верхней границы.

Компьютерная память , аппаратное обеспечение, в котором хранятся значения данных, бывает разных форм.Оперативная память (ОЗУ) — это термин, обычно используемый для описания памяти, расположенной ближе всего к центральному процессору. Эта память является временной - значения данных в ОЗУ сохраняются только во время работы компьютера (они исчезают, когда компьютер выключается) - и это быстро - значения могут быть переданы в ЦП для обработки, а результат может быть передан обратно в оперативную память очень быстро. Оперативной памяти также обычно относительно мало.

Грубо говоря, оперативная память соответствует популярному понятию кратковременной памяти.

Во всех процессах обработки данных обычно задействованы как минимум ОЗУ и ЦП. Значения данных временно сохраняются в ОЗУ, перемещаются в ЦП для выполнения арифметических операций, сравнений или чего-то более сложного, а результат затем сохраняется обратно в ОЗУ. Фундаментальной особенностью языка программирования является возможность хранить значения в ОЗУ и указывать вычисления, которые должен выполнять ЦП.

Возможность хранить данные в оперативной памяти означает, что мы можем выполнить сложную задачу, выполнив ряд более простых шагов. После каждого шага мы записываем промежуточный результат в память, чтобы использовать его на последующих шагах.

Клавиатура является одним из примеров устройств ввода.

Большинство компьютеров также оснащены мышью или сенсорной панелью. Это также примеры устройств ввода, но для целей этой книги нас в основном интересует возможность ввода кода и данных с помощью клавиатуры.

Мы не будем писать код для управления клавиатурой; этот аппаратный компонент более важен для нас как основной способ передачи инструкций и данных на компьютер.

Большинство компьютеров обычно имеют очень большой объем компьютерной памяти, например жесткий диск. Это будет намного больше и намного медленнее, чем ОЗУ, но имеет значительное преимущество, заключающееся в том, что значения данных будут сохраняться при отключении питания. Накопитель — это место, где мы сохраняем все наши файлы и документы.

Связанный набор аппаратных компонентов включает внешние устройства хранения, такие как дисководы CD и DVD, а также флэш-накопители (карты памяти), которые позволяют физически переносить данные с компьютера.

Там, где ОЗУ соответствует кратковременной памяти, запоминающее устройство соответствует долговременной памяти.

Очень важно иметь доступ к массовому хранилищу, поскольку именно там обычно находятся исходные значения данных. Имея доступ к массовому хранилищу, мы также можем постоянно хранить результаты обработки наших данных, а также наш компьютерный код.

Экран компьютера является одним из примеров аппаратного обеспечения вывода. Экран важен как место, где отображаются текст и изображения для отображения результатов наших вычислений.

Возможность управлять тем, что отображается на экране, важна для просмотра результатов наших расчетов и, возможно, для обмена этими результатами с другими.

Большинство современных компьютеров подключены к той или иной сети, состоящей из других компьютеров, принтеров и т. д., а во многих случаях и к Интернету.

Как и в случае с массовым хранилищем, важность доступа к сети заключается в том, что именно там могут находиться исходные значения данных.

Язык программирования позволит нам работать с этими аппаратными компонентами для выполнения всевозможных полезных задач, таких как чтение файлов или документов с жесткого диска в оперативную память, вычисление новых значений и отображение этих новых значений на экране компьютера.

Как организована эта глава

Эта глава начинается с задачи, которую мы, естественно, думаем выполнить вручную, но которую можно выполнить гораздо эффективнее и точнее, если вместо этого мы напишем код на языке программирования для выполнения задачи. Цель этого раздела — показать, насколько полезными могут быть небольшие знания в области программирования, и продемонстрировать, как общая задача может быть разбита на более мелкие задачи, которые мы можем выполнить, написав код.

Разделы 9.2 и 9.3 содержат начальное введение в язык программирования R для выполнения подобных задач. Эти разделы позволят нам написать и запустить очень простой код R.

Раздел 9.4 знакомит с важной идеей структур данных — как значения данных хранятся в ОЗУ. В этом разделе мы узнаем, как вводить значения данных вручную и как эти значения можно организовать. Все задачи обработки данных требуют загрузки значений данных в ОЗУ, прежде чем мы сможем выполнять вычисления со значениями данных.Различные задачи обработки потребуют, чтобы значения данных были организованы и сохранены по-разному, поэтому важно понимать, какие существуют варианты хранения данных в ОЗУ и как работать с каждым из доступных вариантов.

Некоторые дополнительные сведения о структурах данных представлены в Разделе 9.6, но до этого в Разделе 9.5 рассматривается одна из самых основных задач обработки данных — извлечение подмножества из большого набора значений. Возможность разбить большой набор данных на более мелкие части — это один из фундаментальных небольших шагов, которые мы можем выполнить с помощью языка программирования. Решения более сложных задач основаны на сочетании этих небольших шагов.

Раздел 9.7 посвящен тому, как получить данные из внешних файлов в ОЗУ, чтобы мы могли их обрабатывать. Большинство наборов данных постоянно хранятся в той или иной форме массового хранилища, поэтому очень важно знать, как загружать данные из различных форматов хранения в ОЗУ с помощью R .

Раздел 9.8 описывает ряд задач по обработке данных. Большая часть главы до этого момента посвящена закладке фундамента. Этот раздел начинает предоставлять информацию для выполнения мощных вычислений со значениями данных. Опять же, отдельные приемы, которые мы изучаем в этих разделах, служат основой для выполнения более сложных задач. В разделе 9.8.12 приводится более крупное тематическое исследование, демонстрирующее, как можно комбинировать более мелкие этапы для выполнения более серьезной обработки данных.

В разделе 9.9 рассматривается особый случай обработки текстовых данных. Мы рассмотрим инструменты для поиска в тексте, извлечения подмножеств из текста, а также разделения и повторного объединения текстовых значений. В разделе 9.9.2 описываются регулярные выражения, которые являются важным инструментом для поиска шаблонов в тексте.

Раздел 9.10 описывает, как форматировать результаты обработки данных либо для отображения на экране, либо для использования в отчетах об исследованиях.

Раздел 9.11 очень кратко описывает некоторые более продвинутые идеи написания кода на языке программирования, а Раздел 10 содержит несколько комментариев и указателей на альтернативное программное обеспечение и языки программирования для обработки данных. Это более сложные темы, которые дают представление о областях для дальнейшего изучения.

<УЛ>
      • 9 . 0 . 0 . 1 Компьютерное оборудование
      • 9 . 2 . 1 Командная строка
      • 9 . 2 . 2 Рабочая область
      • 9 . 2 . 3 пакета
      • Подведение итогов
      • 9 . 3 . 1 выражение
      • 9 . 3 . 2 постоянных значения
      • 9 . 3 . 3 Арифметика
      • 9 . 3 . 4 условия
      • 9 . 3 . 5 вызовов функций
      • 9 . 3 . 6 Символы и назначение
      • 9 . 3 . 7 ключевых слов
      • 9 . 3 . 8 Flashback: Письмо для аудитории
      • 9 . 3 . 9 Именование переменных
      • Подведение итогов
      • 9 . 4 . 0 . 1 Основные типы данных
      • 9 . 4 . 0 . 2 Основные структуры данных
      • 9 . 4 . 1 Пример из практики: подсчет конфет
      • 9 . 4 . 2 вектора
      • 9 . 4 . 3 фактора
      • 9 . 4 . 4 фрейма данных
      • 9 . 4 . 5 списков
      • 9 . 4 . 6 Матрицы и массивы
      • 9 . 4 . 7 Воспоминание: числа в памяти компьютера
      • Подведение итогов
      • 9 . 5 . 1 Назначение подмножеству
      • 9 . 5 . 2 подмножества факторов
      • Подведение итогов
      • 9 . 6 . 1 Правило утилизации
      • 9 . 6 . 2 Приведение типа
        • 9 . 6 . 2 . 1 Принуждающие факторы
        • 9 . 7 . 1 Рабочий каталог
        • 9 . 7 . 2 Указание файлов
        • 9 . 7 . 3 формата текста.
        • 9 . 7 . 4 Практический пример: Точка Немо (продолжение)
          • 9 . 7 . 4 . 1 Пример read.table()
          • 9 . 7 . 4 . 2 Пример read.fwf()
          • 9 . 7 . 4 . 3 Пример readLines()
          • 9 . 7 . 4 . 4 Пример write.csv()
          • 9 . 8 . 1 Пример из практики: школы Новой Зеландии
          • 9 . 8 . 2 трансформации
            • 9 . 8 . 2 . 1 биннинг
            • 9 . 8 . 11 . 1 плавление
            • 9 . 8 . 11 . 2 Кастинг
            • 9 . 9 . 1 Пример из практики: самое длинное географическое название
            • 9 . 9 . 2 Регулярные выражения
            • 9 . 9 . 3 Пример из практики: ржавая пшеница
            • Подведение итогов
            • 9 . 10 . 1 Пример из практики: Точка Немо (продолжение)
            • 9 . 10 . 2 Преобразование в текст
            • 9 . 10 . 3 результата для отчетов.
            • Подведение итогов
            • 9 . 11 . 1 Пример из практики: выставка данных (продолжение)
            • 9 . 11 . 2 Управление потоком
            • 9 . 11 . 3 Функции записи
            • 9 . 11 . 4 Воспоминание: написание функций, написание кода и принцип DRY
            • 9 . 11 . 5. Воспоминание: отладка
            • Подведение итогов


            Эта работа находится под лицензией Creative Commons Attribution-Noncommercial-Share Alike 3.0 New Zealand.

            Компьютеры называют «инструментами разума», потому что они улучшают нашу способность выполнять задачи, требующие умственной деятельности.Компьютеры прекрасно справляются с такими задачами, как быстрое выполнение вычислений, сортировка больших списков и поиск в обширных информационных библиотеках.

            Человек может выполнять все эти действия, но компьютер часто может выполнять их быстрее и точнее. Наша способность пользоваться компьютером дополняет наши умственные способности и делает нас более продуктивными. Ключом к эффективному использованию компьютера в качестве инструмента является знание того, что делает компьютер, как он работает и как вы можете его использовать. Этот курс кратко посвящен им.

            1.1 - Что такое компьютер?' Компьютер – это устройство, которое принимает ввод, обрабатывает данные, хранит данные и производит вывод.


            Компьютер принимает ввод

            Компьютерный ввод — это все, что вводится в компьютерную систему. Ввод означает подачу информации в компьютер через устройства ввода. Человек может вводить данные через среду или другой компьютер. Некоторыми примерами типов ввода, которые может обрабатывать компьютер, являются слова и символы в документе, числа для вычислений, инструкции для выполнения процесса, изображения, звуковые сигналы с микрофона и температуры от термостата.

            Компьютер обрабатывает данные

            Данные — это символы, описывающие людей, события, вещи и идеи. Компьютеры манипулируют данными разными способами, и мы называем эту манипуляцию «обработкой». Таким образом, в контексте компьютеров мы можем определить процесс как систематическую серию действий, которые компьютер использует для манипулирования данными. Некоторые из способов, которыми компьютер может обрабатывать данные, включают выполнение вычислений, сортировку списков слов или чисел, изменение документов и изображений в соответствии с инструкциями пользователя и построение графиков. Компьютер обрабатывает данные в устройстве, называемом центральным процессором или ЦП.

            Компьютер хранит данные

            Компьютер должен хранить данные, чтобы они были доступны для обработки. Места, в которые компьютер помещает данные, называются хранилищем. Большинство компьютеров имеют более одного места для хранения данных. Место, где компьютер хранит данные, зависит от того, как данные используются. Компьютер помещает данные в одно место, пока они ожидают обработки, и в другое место, когда они не нужны для непосредственной обработки. Память — это область, в которой хранятся данные, ожидающие обработки. Вторичное хранилище — это область, где данные можно оставить на постоянной основе, пока они не нужны для обработки.

            Компьютер производит вывод

            Компьютерный вывод — это результаты, полученные компьютером. «Выход» означает процесс производства продукта. Некоторые примеры компьютерного вывода включают отчеты, документы, музыку, графики и изображения. Устройство вывода отображает, распечатывает или передает результаты обработки с компьютера в память.


            1.2 — Основы компьютерной системы

            Компьютерная система включает в себя компьютерные периферийные устройства и программное обеспечение. Электрические, электронные и механические устройства, используемые для обработки данных, называются аппаратными средствами. Помимо самого компьютера, термин «аппаратное обеспечение» относится к компонентам, называемым периферийными устройствами, которые расширяют возможности компьютера по вводу, выводу и хранению данных. Компьютерное оборудование само по себе не является особенно полезным инструментом разума. Чтобы быть полезным, компьютеру требуется набор инструкций, называемый программным обеспечением или компьютерной программой, который сообщает компьютеру, как выполнять определенную задачу.

            1.3 — Компьютерное оборудование

            Компьютерное оборудование состоит из осязаемых, видимых и занимающих место частей. На рис. 1.3 показаны основные компоненты аппаратного обеспечения компьютера. Компьютерное оборудование подразделяется на следующие категории: системный блок, устройства ввода, устройства вывода и вторичные хранилища.


            Системный блок - системный блок размещается в корпусе компьютера. Системный блок состоит из электронной схемы, состоящей из двух частей.

            Центральный процессор (ЦП) контролирует данные и обрабатывает их для получения информации. Центральный процессор компьютера содержится на одной интегральной схеме или микропроцессорном чипе. Эти микросхемы называются микропроцессорами.

            Память, также известная как первичная память, содержит данные и программные инструкции для обработки данных. Он также содержит обработанную информацию до ее вывода. Память иногда называют временным хранилищем, потому что она будет потеряна при отключении электропитания компьютера. Данные и инструкции хранятся в памяти только до тех пор, пока питание компьютера включено. Память размещена в системном блоке на миниатюрных микросхемах памяти.

            Устройства вывода. Устройства вывода — это элементы оборудования, которые переводят обработанную информацию из ЦП в форму, понятную людям. Одним из наиболее важных устройств вывода является монитор или экран компьютера, который может напоминать экран телевизора. Еще одним важным устройством вывода является принтер.

            Устройства ввода. Устройства ввода — это оборудование, которое преобразует данные и программы, понятные человеку, в форму, которую может обработать компьютер. Наиболее распространенными устройствами ввода являются клавиатура и мышь. Клавиатура на компьютере похожа на клавиатуру пишущей машинки, но имеет дополнительные специализированные клавиши. Мышь — это устройство, которое обычно катается на рабочем столе. Он направляет курсор или указатель на экран дисплея. Мышь обычно имеет две кнопки для ввода команд. Он также используется для рисования фигур.


            Вторичная память. Вторичная память также содержит данные и программы. Однако хранится постоянно. То есть данные и программы остаются даже после отключения электроэнергии. Вторичные запоминающие устройства располагаются вне центрального процессора, хотя могут быть встроены в корпус системного блока. Наиболее важными типами вторичных носителей информации являются следующие:

            Диски/CD-ROM содержат данные или программы в виде намагниченных пятен на пластиковых пластинах. Носители данных вставляются в дисководы. Механизм считывает данные с диска. То есть намагниченные пятна на диске преобразуются в электронные сигналы и передаются в первичную память внутри компьютера. Емкость дискеты составляет 1,44 Мегабайта (МБ), а компакт-диска – 650–700 Мегабайт (МБ).

            USB-флеш-накопитель – небольшой легкий съемный накопитель данных. Его емкость варьируется от 64 МБ, 126 МБ, 512 МБ, 1 ГБ и 2 ГБ. Однако по мере развития технологий совершенствуются и такие устройства хранения.

            Жесткий диск (или жесткий диск) содержит один или несколько металлических дисков, заключенных в дисковод. Как и дискеты, жесткие диски содержат данные или программы в виде намагниченных пятен. Они также читают и записывают данные почти так же, как и другие упомянутые выше диски для хранения данных. Однако емкость жесткого диска во много раз больше, чем у гибкого диска (10 – 40 ГБ).


            1.4 – Компьютерное программное обеспечение

            Программное обеспечение — это другое название программ. Программы — это инструкции, которые сообщают компьютеру, как обрабатывать данные в желаемой форме. В большинстве случаев слова программное обеспечение и программы взаимозаменяемы.

            Существует два вида программного обеспечения: прикладное программное обеспечение и системное программное обеспечение. Вы можете думать о прикладном программном обеспечении как о том виде, который вы используете. Думайте о системном программном обеспечении как о том, что использует компьютер.

            • Microsoft Word — используется для подготовки письменных документов
            • Microsoft Excel – используется для анализа и обобщения данных.
            • Microsoft Access – используется для организации данных и информации и управления ими.
            • Коммуникационные программы, используемые для передачи и приема, т.е. Internet Explorer, Fire fox – Mozila.

            Ваши команды, идеи, требования и концепции формируют данные, которые ваша система обрабатывает и хранит. Без вмешательства пользователя компьютер просто занимает место на рабочем столе и ждет указаний, как заблудившийся автомобилист со сломанной машиной. Без методов и устройств ввода ваша переписка, отчеты, изображения и цифры остаются в вашей голове, а не становятся незавершенной работой. Ваш компьютер может принимать данные от множества типов периферийных устройств, каждое из которых предназначено для работы с определенными типами данных.

            Клавиатуры

            Проводные и беспроводные клавиатуры разбивают лингвистический ввод и программные команды на отдельные смысловые единицы. Вы можете ввести одну букву, комбинировать буквенно-цифровые клавиши с командными клавишами для создания акцентированных или специальных символов, а также вводить простые или сложные инструкции для управления программными процессами. От традиционной клавиатуры QWERTY, адаптированной от пишущей машинки, до таких раскладок, как клавиатура Дворака, которая способствует более быстрому набору текста, и адаптированных вариантов с дополнительными клавишами, эти устройства преобразуют нажатия клавиш пальцами в ввод данных.

            Указывающие устройства

            Указывающие устройства преобразуют прикосновения, жесты и вводимые данные через проводные или беспроводные интерфейсы. От нажатия на меню с помощью мыши или трекбола до касания сенсорной панели или сенсорного экрана или рисования на графическом планшете — эти устройства инициируют команды и помогают ретушировать фотографии, создавать иллюстрации и имитировать поведение других устройств, включая кисти и аэрографы. Шайбы САПР позволяют установить точные точки отсчета на архитектурном плане или 3D-рендеринге. С точки зрения развлечения, мир компьютерных игр опирается на устройства, которые переводят трехмерные жесты в мир авиасимулятора, боевой сцены или гоночной трассы, включая джойстики, игровые планшеты и симуляторы вождения.

            Диски данных

            На флэш-памяти, оптических и жестких дисках хранятся выходные данные компьютерных процессов, но они также обеспечивают ввод данных для других функций.От файлов, содержащих данные, которыми нужно манипулировать, до временного хранилища данных, обеспечивающего ввод данных из буфера обмена или программы, эти устройства упрощают и ускоряют процесс предоставления информации программным процессам. Некоторые из этих устройств содержат подвижные пластины, в то время как другие используют твердотельные флэш-чипы NAND или вставленные перезаписываемые оптические диски с возможностью записи. Их можно установить как внутренние компоненты компьютера или подключить к порту USB, FireWire или Thunderbolt.

            Аудио/видеоустройства

            Компьютеры принимают широкий спектр входных аудиоданных. Вы можете диктовать аудиовход в гарнитуру для использования в программе преобразования текста в речь, которая преобразует ваши слова в текстовую обработку, петь или играть на музыкальном инструменте в микрофон для записи в аудиофайл, подключать электронный инструмент к компьютеру для прямой ввод синтезированных звуков или передача звука с записывающего устройства. Для внесения визуальной информации в новый или существующий документ можно оцифровать объекты или распечатанную информацию на двух- или трехмерном сканере, передать файлы с цифровой камеры или комбинированный аудио/видео ввод с видеокамеры, записать отдельное или целое сцена наблюдения, снятая на веб-камеру или камеру видеонаблюдения.

            MIDI-устройства

            Клавиатуры, синтезаторы и другие музыкальные технологии обеспечивают компьютерный ввод в виде MIDI-данных. Спецификация цифрового интерфейса музыкальных инструментов включает три типа путей передачи данных, принимаемых и передаваемых через порты MIDI IN, MIDI OUT и MIDI THRU. Инструменты подключаются к разъему MIDI IN на компьютерном интерфейсе, который подключается к USB или другому стандартному порту данных. Инструменты подключаются к последовательно подключенным устройствам с помощью своих разъемов MIDI THRU, что позволяет выходу одного устройства управлять или влиять на поведение другого.

            Специализированное оборудование

            От испытательного и диагностического оборудования, лабораторных измерительных устройств и производственного оборудования до вспомогательных технологий, которые делают компьютеры доступными для людей с ограниченными возможностями, специализированное оборудование ввода решает столь же специализированные проблемы или преодолевает определенные проблемы. Наряду с устройствами, предназначенными для медицинского, научного, инженерного и производственного использования, эти устройства ввода специального назначения включают оборудование для жестов, которое преобразует трехмерное движение рук или тела в движение персонажа для анимации или заменяет обычные указательные устройства.

            Четыре функции компьютера фактически объясняют основные причины его создания. К ним относятся:

            • Ввод данных
            • Обработка данных.
            • Вывод информации.
            • Хранение данных и информации.

            Иллюстрация четырех функций компьютера

            Чтобы проиллюстрировать четыре функции компьютера, мы можем взглянуть на основные шаги, через которые мы все проходим, чтобы создать ПИСЬМО на компьютере.

            Он начинается, когда пользователь составляет, вводит и редактирует наборы букв, цифр и символов с помощью клавиатуры. Затем необработанные данные обрабатываются и просматриваются в режиме реального времени на оборудовании дисплея.

            Наконец, пользователь может распечатать письмо на бумаге или, что еще лучше, отправить его по электронной почте назначенным получателям.

            Те же данные и информация могут храниться в цифровом виде на дисках и других носителях для дальнейшего использования.

            1. Ввод данных

            Каждый компьютер предназначен для ввода данных в качестве первой функции, действия, которое выполняется с помощью устройств ввода.

            Ввод данных осуществляется вручную, автоматически или и тем, и другим. Ручной ввод осуществляется с помощью дополнительных периферийных устройств, таких как клавиатура, мышь и стилус. Ввод также может осуществляться с помощью приложений голосовой диктовки и периферийных устройств для жестов, таких как Kinect и биометрические устройства. В других местах ввод данных также осуществляется с использованием дополнительных носителей данных и сетевых интерфейсов.

            Прикладное программное обеспечение, используемое для этой цели, также определяет ввод данных. Программное обеспечение для обработки текстов предназначено для ввода основных буквенно-цифровых данных, а приложение для редактирования фотографий используется для ввода и обработки изображений.

            Эти данные могут быть введены в базу данных, электронную таблицу или другие формы компьютеризированной рабочей области.

            Автоматизированные приложения и робототехника также могут использоваться для интеллектуального ввода данных в компьютер на станции или удаленно. Например, подведение итогов избирательного процесса может осуществляться удаленно и автоматически.

            Обработка данных относится к преобразованию необработанных данных в осмысленные выходные данные.

            Данные могут быть получены вручную с помощью ручки и бумаги, механически с использованием простых устройств, например, пишущей машинки, или в электронном виде с использованием современных средств обработки данных, например, компьютеров.

            Сбор данных включает получение данных/фактов, необходимых для обработки, с места своего происхождения на компьютер

            Ввод данных — собранные данные преобразуются в машиночитаемую форму с помощью устройства ввода и отправляются в машину.

            Обработка — это преобразование входных данных в более осмысленную форму (информацию) в ЦП

            Вывод — это получение необходимой информации, которая может быть введена в будущем.

            Разница между сбором данных и сбором данных.

            Сбор данных — это процесс получения данных в машиночитаемой форме в точке происхождения (сам исходный документ подготавливается в машиночитаемой форме для ввода)

            Сбор данных включает передачу исходных данных в «центр обработки», их расшифровку, преобразование с одного носителя на другой и, наконец, ввод их в компьютер.

            Актуальность термина "мусор в мусоре" (GIGO) в отношении ошибок при обработке данных.

            Точность данных, введенных в компьютер, напрямую определяет точность выдаваемой информации.

            Приведите и объясните две ошибки транскрипции и две ошибки вычислений, допущенные при обработке данных.

            Ошибки неправильного прочтения: - они возникают, когда пользователь неправильно читает исходный документ, в результате чего вводятся неправильные значения, например. пользователь может перепутать 5 в числе 586 с буквой S и ввести вместо нее S86.

            Ошибки транспонирования: - возникают из-за неправильного расположения символов (т. е. размещения символов в неправильном порядке, особенно при вводе данных на дискету), например. пользователь может ввести 396 вместо 369 вычислительных ошибок

            • Недополнение
            • Усечение: 0,784969 784
            • Ошибка округления: 30,6666 7
            • Алгоритм или логические ошибки

            Целостность данных.

            Под целостностью данных понимается надежность, своевременность, доступность, актуальность, точность и полнота данных/информации

            Угрозы целостности данных

            • Человеческая ошибка, злонамеренная или непреднамеренная.
            • Ошибки передачи, включая непреднамеренные изменения или компрометацию данных во время передачи с одного устройства на другое.
            • Ошибки, вирусы/вредоносное ПО, взлом и другие киберугрозы.
            • Скомпрометированное оборудование, например сбой устройства или диска.

            Способы минимизации угроз целостности данных.

            • Резервное копирование данных на внешний носитель
            • Применение мер безопасности для контроля доступа к данным
            • Использование программного обеспечения для обнаружения и исправления ошибок при передаче данных
            • Разработка пользовательских интерфейсов, сводящих к минимуму вероятность ввода неверных данных.

            Методы обработки данных

            <р>1. Ручная обработка данных

            При обработке данных вручную данные обрабатываются вручную без использования какой-либо машины или инструмента для получения требуемых результатов. При ручной обработке данных все вычисления и логические операции выполняются над данными вручную. Точно так же данные переносятся вручную из одного места в другое. Этот метод обработки данных очень медленный, и на выходе могут возникать ошибки. В основном, обрабатывается вручную во многих фирмах малого бизнеса, а также в государственных учреждениях и учреждениях. В образовательном учреждении, например, листы оценок, квитанции об оплате и другие финансовые расчеты (или транзакции) выполняются вручную. Этот метод избегают, насколько это возможно, из-за очень высокой вероятности ошибки, трудоемкости и больших затрат времени. Этот тип обработки данных формирует очень примитивную стадию, когда технологии не были доступны или были недоступны. С развитием технологий зависимость от ручных методов резко уменьшилась.

            <р>2. Механическая обработка данных

            В методе механической обработки данных данные обрабатываются с помощью различных устройств, таких как пишущие машинки, механические принтеры или другие механические устройства. Этот метод обработки данных быстрее и точнее, чем ручная обработка данных. Это быстрее, чем в ручном режиме, но все же формирует ранние этапы обработки данных. С изобретением и развитием более сложных машин с большей вычислительной мощностью этот тип обработки также начал исчезать. Экзаменационные доски и печатные станки часто используют механические устройства обработки данных.

            <р>3. Электронная обработка данных

            Электронная обработка данных или EDP — это современный метод обработки данных.Данные обрабатываются через компьютер; Данные и набор инструкций передаются компьютеру в качестве входных данных, и компьютер автоматически обрабатывает данные в соответствии с заданным набором инструкций. Компьютер также известен как машина электронной обработки данных.

            Этот метод обработки данных очень быстрый и точный. Например, в компьютеризированной образовательной среде результаты учащихся готовятся с помощью компьютера; в банках счета клиентов ведутся (или обрабатываются) через компьютеры и т. д.

            а. Пакетная обработка

            Пакетная обработка — это метод, при котором информация, которую необходимо организовать, сортируется по группам для обеспечения эффективной и последовательной обработки. Онлайн-обработка — это метод, в котором используются интернет-соединения и оборудование, напрямую подключенное к компьютеру. Он используется в основном для записи информации и исследований. Обработка в реальном времени — это метод, который позволяет почти мгновенно реагировать на различные сигналы для получения и обработки информации. Распределенная обработка обычно используется удаленными рабочими станциями, подключенными к одной большой центральной рабочей станции или серверу. Банкоматы являются хорошими примерами этого метода обработки данных.

            б. Онлайн-обработка

            В этом методе используются подключения к Интернету и оборудование, напрямую подключенное к компьютеру. Это позволяет хранить данные в одном месте, а использовать их в совершенно другом месте. Облачные вычисления можно рассматривать как пример, в котором используется этот тип обработки. Он используется в основном для записи информации и исследований.

            <р>в. Обработка в реальном времени

            Этот метод позволяет почти мгновенно реагировать на различные сигналы, чтобы получать и обрабатывать информацию. Они связаны с высокими затратами на техническое обслуживание и первоначальными затратами, связанными с очень передовыми технологиями и вычислительной мощностью. Экономия времени в этом случае максимальна, так как результат виден в режиме реального времени. Например, в банковских операциях

            Пример обработки в реальном времени

            • Системы бронирования авиабилетов
            • Бронирование театра (кино)
            • Бронирование мест в отелях
            • Банковские системы
            • Полицейские справочные системы
            • Химические заводы
            • Больницы для наблюдения за состоянием пациента
            • Системы управления ракетами
            • Предоставляет актуальную информацию
            • Информация доступна для мгновенного принятия решений.
            • Предоставляет более качественные услуги пользователям/клиентам.
            • Быстро и надежно
            • Уменьшает тираж бумажных копий.

            Недостатки

            • Требуются сложные ОС и они очень дорогие.
            • Нелегко разрабатывать
            • Системы реального времени обычно используют 2 или более процессоров для разделения рабочих нагрузок, что дорого обходится.
            • Требуется большое коммуникационное оборудование.

            д. Распределенная обработка

            Этот метод обычно используется удаленными рабочими станциями, подключенными к одной большой центральной рабочей станции или серверу. Банкоматы являются хорошими примерами этого метода обработки данных. Все конечные машины работают на фиксированном программном обеспечении, расположенном в определенном месте, и используют одну и ту же информацию и наборы инструкций.

            Разница между заданиями, привязанными к процессору, и заданиями, связанными с вводом-выводом.

            Задания, привязанные к ЦП, требуют больше процессорного времени для обработки этих заданий. Большая часть работы, которую выполняют устройства ввода-вывода, выполняется на входе; и выход; следовательно, они требуют очень мало процессорного времени.

            В настоящее время большинство компаний отказываются от использования географически распределенных персональных компьютеров. Этот метод обработки данных называется распределенной обработкой данных (DDP)

            .

            Три вычислительных ресурса, которые можно распределять.

            -Время ЦП (процессоров)

            -Мощность компьютера

            -Память (компьютерная память)

            - Устройства ввода/вывода, например. принтеры

            -коммуникационные устройства/коммуникационный порт

            Примеры отраслей и коммерческих организаций, широко использующих системы распределенной обработки.

            • Банки
            • Компьютеризированные розничные магазины, например супермаркеты
            • Учебные заведения со многими подразделениями.
            • Бюро или интернет-кафе для общения
            • Системы бронирования авиабилетов

            Преимущества и три риска, которые могут быть связаны с распределенной системой обработки данных.

            Тзначительно снижается нагрузка на хост-компьютер

            • Использование недорогих миникомпьютеров минимизирует затраты на обработку данных.
            • Задержки в обработке данных сокращаются
            • Повышает качество обслуживания клиентов.
            • Меньший риск в случае сбоя системы.
            • Дизайн и реализация системы менее сложны благодаря децентрализации.
            • Требуется меньший уровень знаний.

            Риски

              • Дублирование данных очень распространено
              • Проблемы программирования возникают при использовании микрокомпьютеров и миникомпьютеров.
              • Угрозы безопасности, то есть данные и информация, отправленные по сети из одного места в другое
              • другое может прослушиваться или прослушиваться посторонними лицами
              • Необходимо дополнительное обучение вовлеченных пользователей.
              • Это дорого из-за дополнительных затрат на коммуникационное оборудование.

              Концепция мультипрограммирования

              Мультипрограммная система позволяет пользователю одновременно запускать 2 или более программ, каждая из которых находится в основной памяти компьютера.

              Преимущества мультипрограммирования

              • Повышает производительность компьютера
              • Уменьшает время простоя ЦП
              • Снижает частоту операций с периферийными границами.

              Преимущества хранения данных в компьютерных файлах по сравнению с ручной системой хранения файлов

              • Сохраняемая информация занимает меньше места
              • Легче обновлять и изменять
              • Обеспечивает более быстрый доступ к данным и их извлечение.
              • Уменьшает дублирование данных или сохраненных записей.
              • Дешевле
              • Повышает целостность данных (то есть точность и полноту)

              Разница между логическими и физическими компьютерными файлами.

              Логический файл рассматривается с точки зрения того, какие элементы данных он содержит и какие операции обработки могут быть выполнены с данными

              Физический файл рассматривается с точки зрения того, как элементы данных, найденные в файле, расположены на носителе и как их можно обрабатывать.

              Расположите следующие компоненты иерархии данных информационной системы в порядке возрастания сложности:

              Поле, база данных, байт, запись, бит и файл

              База данных файла записи бит-байтового поля

              ТИПЫ КОМПЬЮТЕРНЫХ ФАЙЛОВ

              i) Файл отчета. Он содержит набор относительно постоянных записей, извлеченных из данных в главном файле.

              Они используются для подготовки отчетов, которые могут быть распечатаны позже, например. отчет об успеваемости учащегося за семестр, выписка об учащемся, не оплатившем плату за обучение, отчет об отсутствующих
              ii) Файл резервной копии — используется для резервного копирования данных или для хранения дубликатов данных/информации из стационарного хранилища компьютера или основной файл в целях безопасности, например копия всех принятых в школу учащихся, отчет об отсутствующих

              iii) Справочный файл — используется для справочных целей. Он содержит записи, которые являются довольно постоянными или полупостоянными, например. Отчисления в залог, ставки заработной платы, налоговые отчисления, адреса сотрудников, прайс-листы и т. д.

              iv) Файл сортировки — используется для сортировки/ранжирования данных в соответствии с заданным порядком, например. место в классе учеников.
              v) Файл транзакции — используется для хранения входных данных во время обработки транзакции. Позже он используется для обновления мастер-файлов и аудита ежедневных, еженедельных или ежемесячных транзакций.

              МЕТОДЫ ОРГАНИЗАЦИИ ФАЙЛОВ

              Что такое файловая организация?

              1. Это то, как записи упорядочиваются (размещаются) в определенном файле или любом дополнительном устройстве хранения данных на компьютере.
              2. Относится к способу хранения данных в файле.
              3. Организация файлов важна, поскольку она определяет метод доступа, эффективность, гибкость и используемые устройства хранения.

              Способы организации файлов

              i) Последовательный и серийный

              При последовательной организации файлов записи хранятся в отсортированном порядке с использованием

              ключевое поле, а в serial; записи хранятся в том порядке, в котором они попадают в файл, и никаким образом не сортируются.

              ii) Случайный и индексированный-последовательный

              При случайной файловой организации записи хранятся в файле случайным образом и доступны напрямую, тогда как при индексированно-последовательном записи хранятся последовательно, но доступ к ним осуществляется напрямую с помощью индекса. .

              iii) последовательная организация файлов

              Записи в файле хранятся и доступны друг за другом на носителе данных

              iv) Индексированный последовательный метод организации файлов

              Аналогично последовательному методу, только индекс используется для того, чтобы компьютер мог находить отдельные записи на носителе.

              РЕЖИМЫ ОБРАБОТКИ ЭЛЕКТРОННЫХ ДАННЫХ
              Это способы, которыми компьютер под влиянием операционной системы предназначен для обработки данных, например
              a) Пакетная обработка - это выполнение ряда заданий в программа на компьютере без ручного вмешательства (неинтерактивная). Строго говоря, это режим обработки: выполнение серии программ, каждая из которых работает с набором или «пакетом» входных данных, а не с одним вводом (который вместо этого был бы пользовательским заданием). ). Однако это различие в значительной степени утеряно, и ряд шагов в пакетном процессе часто называют "заданием" или "пакетным заданием".

              Пакетная обработка имеет следующие преимущества:=

              • Это может сместить время обработки задания на период, когда вычислительные ресурсы менее загружены.
              • Это позволяет избежать простоя вычислительных ресурсов благодаря ежеминутному ручному вмешательству и контролю.
              • Поддерживая высокий общий коэффициент использования, он амортизирует компьютер, особенно дорогой.
              • Это позволяет системе использовать разные приоритеты для интерактивной и неинтерактивной работы.
              • Вместо того, чтобы запускать одну программу несколько раз для обработки одной транзакции каждый раз, пакетные процессы будут запускать программу только один раз для многих транзакций, что снижает нагрузку на систему.

              Недостатки
              : пользователи не могут завершить процесс во время выполнения и должны ждать завершения выполнения.

              Читайте также: