В каком виде информация различных типов обрабатывается компьютером

Обновлено: 17.07.2026

Компьютер — это машина для обработки информации. Компьютеры обрабатывают данные для получения информации.

Наборы инструкций, которые люди дают компьютерам, называются программами или программным обеспечением.

Программное обеспечение, которое выполняет определенный тип задач для пользователя, часто называют прикладным программным обеспечением.

Есть много причин для использования компьютеров:

Компьютеры могут работать намного быстрее людей;
Компьютеры никогда не устают и не нуждаются в отдыхе.
Компьютеры могут выполнять работу, которую человеку было бы опасно выполнять;
Компьютеры могут хранить большие объемы информации на очень маленьком пространстве.
Компьютеры могут очень быстро находить информацию;
Компьютеры никогда не теряют и не помещают информацию не на место.

Три стадии вычислений: ввод, обработка и вывод.

Компьютер проходит через эти этапы, «запуская» программу. Программа — это набор пошаговых инструкций, которые точно сообщают компьютеру, что делать с входными данными, чтобы получить требуемый результат.

Этот этап вычислений связан с передачей данных, необходимых программе, в компьютер.
Для этого используются устройства ввода.
Наиболее часто используемыми устройствами ввода являются мышь и клавиатура.

Инструкции о том, что делать с входными данными, содержатся в программе.
Во время обработки компьютер следует этим инструкциям, используя только что введенные данные.
То, что компьютер производит в конце этого этапа, называется выводом.

Этот этап вычислений связан с представлением обработанных данных в виде информации в удобной для пользователя форме.
Для этого используются устройства вывода.
Наиболее часто используемыми устройствами вывода являются экран, который также называется монитором или визуальным дисплеем (VDU), и принтер.

Данные – это любой набор чисел, символов или других символов, закодированный в формате, который можно вводить в компьютер и обрабатывать.
Данные сами по себе не имеют значения или контекста.
Только после обработки компьютером данные обретают контекст и становятся информацией.
Существует много типов данных
Все данные в конечном итоге хранятся в виде набора чисел внутри компьютера.
Данные могут быть введены пользователем в компьютер разными способами.
К основным типам данных, которые можно вводить в компьютер и обрабатывать, относятся числовые данные, текст, даты, графика и звук.

Системы обработки данных

В этом видео рассматриваются системы обработки данных

Оборудование — это название, которое дается любой части компьютера, к которой вы можете прикоснуться.
Отдельное оборудование называется устройством.
Основное аппаратное обеспечение любого компьютера состоит из центрального процессора (ЦП), а также устройств ввода, вывода и вспомогательных устройств хранения.

Центральный процессор (CPU)

Это часть компьютера, где происходит поиск и сортировка данных, вычисления и принятие решений.
ЦП содержит основную память, блок управления и арифметико-логическое устройство (ALU).

Введение в процессоры

В этом видео объясняются части процессора и функции каждой части. Центральный процессор содержит арифметико-логический блок, выполняющий все арифметические операции, а также функции И/ИЛИ, и блок управления, в котором принимаются решения о сборе и отправке данных.

Обработка данных относится к преобразованию необработанных данных в осмысленные выходные данные.

Данные могут быть получены вручную с помощью ручки и бумаги, механически с использованием простых устройств, например, пишущей машинки, или в электронном виде с использованием современных средств обработки данных, например, компьютеров.

Сбор данных включает получение данных/фактов, необходимых для обработки, с места своего происхождения на компьютер

Ввод данных — собранные данные преобразуются в машиночитаемую форму с помощью устройства ввода и отправляются в машину.

Обработка — это преобразование входных данных в более осмысленную форму (информацию) в ЦП

Вывод — это получение необходимой информации, которая может быть введена в будущем.

Разница между сбором данных и сбором данных.

Сбор данных — это процесс получения данных в машиночитаемой форме в точке происхождения (сам исходный документ подготавливается в машиночитаемой форме для ввода)

Сбор данных включает передачу исходных данных в «центр обработки», их расшифровку, преобразование с одного носителя на другой и, наконец, ввод их в компьютер.

Актуальность термина "мусор в мусоре" (GIGO) в отношении ошибок при обработке данных.

Точность данных, введенных в компьютер, напрямую определяет точность выдаваемой информации.

Приведите и объясните две ошибки транскрипции и две ошибки вычислений, допущенные при обработке данных.

Ошибки неправильного прочтения: - они возникают, когда пользователь неправильно читает исходный документ, в результате чего вводятся неправильные значения, например. пользователь может перепутать 5 в числе 586 с буквой S и ввести вместо нее S86.

Ошибки транспонирования: - возникают из-за неправильного расположения символов (т. е. размещения символов в неправильном порядке, особенно при вводе данных на дискету), например. пользователь может ввести 396 вместо 369 вычислительных ошибок

Недополнение
Усечение: 0,784969 784
Ошибка округления: 30,6666 7
Алгоритм или логические ошибки

Целостность данных.

Под целостностью данных понимается надежность, своевременность, доступность, актуальность, точность и полнота данных/информации

Угрозы целостности данных

Человеческая ошибка, злонамеренная или непреднамеренная.
Ошибки передачи, включая непреднамеренные изменения или компрометацию данных во время передачи с одного устройства на другое.
Ошибки, вирусы/вредоносное ПО, взлом и другие киберугрозы.
Скомпрометированное оборудование, например сбой устройства или диска.

Способы минимизации угроз целостности данных.

Резервное копирование данных на внешний носитель
Применение мер безопасности для контроля доступа к данным
Использование программного обеспечения для обнаружения и исправления ошибок при передаче данных
Разработка пользовательских интерфейсов, сводящих к минимуму вероятность ввода неверных данных.

Методы обработки данных

<р>1. Ручная обработка данных

При обработке данных вручную данные обрабатываются вручную без использования какой-либо машины или инструмента для получения требуемых результатов. При ручной обработке данных все вычисления и логические операции выполняются над данными вручную. Точно так же данные переносятся вручную из одного места в другое. Этот метод обработки данных очень медленный, и на выходе могут возникать ошибки. В основном, обрабатывается вручную во многих фирмах малого бизнеса, а также в государственных учреждениях и учреждениях. В учебном заведении, например, ведомости оценок, квитанции об оплате и другие финансовые расчеты (или транзакции) выполняются вручную. Этот метод избегают, насколько это возможно, из-за очень высокой вероятности ошибки, трудоемкости и больших затрат времени. Этот тип обработки данных формирует очень примитивную стадию, когда технологии не были доступны или были недоступны. С развитием технологий зависимость от ручных методов резко уменьшилась.

<р>2. Механическая обработка данных

В методе механической обработки данных данные обрабатываются с помощью различных устройств, таких как пишущие машинки, механические принтеры или другие механические устройства. Этот метод обработки данных быстрее и точнее, чем ручная обработка данных. Это быстрее, чем в ручном режиме, но все же формирует ранние этапы обработки данных. С изобретением и развитием более сложных машин с большей вычислительной мощностью этот тип обработки также начал исчезать. Экзаменационные доски и печатные станки часто используют механические устройства обработки данных.

<р>3. Электронная обработка данных

Электронная обработка данных или EDP — это современный метод обработки данных. Данные обрабатываются через компьютер; Данные и набор инструкций передаются компьютеру в качестве входных данных, и компьютер автоматически обрабатывает данные в соответствии с заданным набором инструкций. Компьютер также известен как машина электронной обработки данных.

Этот метод обработки данных очень быстрый и точный. Например, в компьютеризированной образовательной среде результаты учащихся готовятся с помощью компьютера; в банках счета клиентов ведутся (или обрабатываются) через компьютеры и т. д.

а. Пакетная обработка

Пакетная обработка — это метод, при котором информация, которую необходимо организовать, сортируется по группам для обеспечения эффективной и последовательной обработки. Онлайн-обработка — это метод, в котором используются интернет-соединения и оборудование, напрямую подключенное к компьютеру. Он используется в основном для записи информации и исследований.Обработка в реальном времени — это метод, который позволяет почти мгновенно реагировать на различные сигналы для получения и обработки информации. Распределенная обработка обычно используется удаленными рабочими станциями, подключенными к одной большой центральной рабочей станции или серверу. Банкоматы являются хорошими примерами этого метода обработки данных.

б. Онлайн-обработка

В этом методе используются подключения к Интернету и оборудование, напрямую подключенное к компьютеру. Это позволяет хранить данные в одном месте, а использовать их в совершенно другом месте. Облачные вычисления можно рассматривать как пример, в котором используется этот тип обработки. Он используется в основном для записи информации и исследований.

<р>в. Обработка в реальном времени

Этот метод позволяет почти мгновенно реагировать на различные сигналы, чтобы получать и обрабатывать информацию. Они связаны с высокими затратами на техническое обслуживание и первоначальными затратами, связанными с очень передовыми технологиями и вычислительной мощностью. Экономия времени в этом случае максимальна, так как результат виден в режиме реального времени. Например, в банковских операциях

Пример обработки в реальном времени

Системы бронирования авиабилетов
Бронирование театра (кино)
Бронирование мест в отелях
Банковские системы
Полицейские справочные системы
Химические заводы
Больницы для наблюдения за состоянием пациента
Системы управления ракетами

Предоставляет актуальную информацию
Информация доступна для мгновенного принятия решений.
Предоставляет более качественные услуги пользователям/клиентам.
Быстро и надежно
Уменьшает тираж бумажных копий.

Недостатки

Требуются сложные ОС и они очень дорогие.
Нелегко разрабатывать
Системы реального времени обычно используют 2 или более процессоров для разделения рабочих нагрузок, что дорого обходится.
Требуется большое коммуникационное оборудование.

д. Распределенная обработка

Этот метод обычно используется удаленными рабочими станциями, подключенными к одной большой центральной рабочей станции или серверу. Банкоматы являются хорошими примерами этого метода обработки данных. Все конечные машины работают на фиксированном программном обеспечении, расположенном в определенном месте, и используют одну и ту же информацию и наборы инструкций.

Разница между заданиями, привязанными к процессору, и заданиями, связанными с вводом-выводом.

Задания, привязанные к ЦП, требуют больше процессорного времени для обработки этих заданий. Большая часть работы, которую выполняют устройства ввода-вывода, выполняется на входе; и выход; следовательно, они требуют очень мало процессорного времени.

В настоящее время большинство компаний отказываются от использования географически распределенных персональных компьютеров. Этот метод обработки данных называется распределенной обработкой данных (DDP)

Три вычислительных ресурса, которые можно распределять.

-Время ЦП (процессоров)

-Мощность компьютера

-Память (компьютерная память)

- Устройства ввода/вывода, например. принтеры

-коммуникационные устройства/коммуникационный порт

Примеры отраслей и коммерческих организаций, широко использующих системы распределенной обработки.

Банки
Компьютеризированные розничные магазины, например супермаркеты
Учебные заведения со многими подразделениями.
Бюро или интернет-кафе для общения
Системы бронирования авиабилетов

Преимущества и три риска, которые могут быть связаны с распределенной системой обработки данных.

Тзначительно снижается нагрузка на хост-компьютер

Использование недорогих миникомпьютеров минимизирует затраты на обработку данных.
Задержки в обработке данных сокращаются
Повышает качество обслуживания клиентов.
Меньший риск в случае сбоя системы.
Дизайн и реализация системы менее сложны благодаря децентрализации.
Требуется меньший уровень знаний.

Риски

Дублирование данных очень распространено
Проблемы программирования возникают при использовании микрокомпьютеров и миникомпьютеров.
Угрозы безопасности, то есть данные и информация, отправленные по сети из одного места в другое
другое может прослушиваться или прослушиваться посторонними лицами
Необходимо дополнительное обучение вовлеченных пользователей.
Это дорого из-за дополнительных затрат на коммуникационное оборудование.

Концепция мультипрограммирования

Система мультипрограммирования позволяет пользователю одновременно запускать 2 или более программ, каждая из которых находится в основной памяти компьютера.

Преимущества мультипрограммирования

Повышает производительность компьютера
Уменьшает время простоя ЦП
Снижает частоту операций с периферийными границами.

Преимущества хранения данных в компьютерных файлах по сравнению с ручной системой хранения файлов

Сохраняемая информация занимает меньше места
Легче обновлять и изменять
Обеспечивает более быстрый доступ к данным и их извлечение.
Уменьшает дублирование данных или сохраненных записей.
Дешевле
Повышает целостность данных (то есть точность и полноту)

Разница между логическими и физическими компьютерными файлами.

Логический файл рассматривается с точки зрения того, какие элементы данных он содержит и какие операции обработки могут быть выполнены с данными

Физический файл рассматривается с точки зрения того, как элементы данных, найденные в файле, расположены на носителе и как их можно обрабатывать.

Расположите следующие компоненты иерархии данных информационной системы в порядке возрастания сложности:

Поле, база данных, байт, запись, бит и файл

База данных файла записи бит-байтового поля

ТИПЫ КОМПЬЮТЕРНЫХ ФАЙЛОВ

i) Файл отчета. Он содержит набор относительно постоянных записей, извлеченных из данных в главном файле.

Они используются для подготовки отчетов, которые могут быть распечатаны позже, например. отчет об успеваемости учащегося за семестр, выписка об учащемся, не оплатившем плату за обучение, отчет об отсутствующих
ii) Файл резервной копии — используется для резервного копирования данных или для хранения дубликатов данных/информации из стационарного хранилища компьютера или основной файл в целях безопасности, например копия всех принятых в школу учащихся, отчет об отсутствующих

iii) Справочный файл — используется для справочных целей. Он содержит записи, которые являются довольно постоянными или полупостоянными, например. Отчисления в залог, ставки заработной платы, налоговые отчисления, адреса сотрудников, прайс-листы и т. д.

iv) Файл сортировки — используется для сортировки/ранжирования данных в соответствии с заданным порядком, например. место в классе учеников.
v) Файл транзакции — используется для хранения входных данных во время обработки транзакции. Позже он используется для обновления мастер-файлов и аудита ежедневных, еженедельных или ежемесячных транзакций.

МЕТОДЫ ОРГАНИЗАЦИИ ФАЙЛОВ

Что такое файловая организация?

Это то, как записи упорядочиваются (размещаются) в определенном файле или любом дополнительном устройстве хранения данных на компьютере.
Относится к способу хранения данных в файле.
Организация файлов важна, поскольку она определяет метод доступа, эффективность, гибкость и используемые устройства хранения.

Способы организации файлов

i) Последовательный и серийный

При последовательной организации файлов записи хранятся в отсортированном порядке с использованием

ключевое поле, а в serial; записи хранятся в том порядке, в котором они попадают в файл, и никаким образом не сортируются.

ii) Случайный и индексированный-последовательный

При случайной файловой организации записи хранятся в файле случайным образом и доступны напрямую, тогда как при индексированно-последовательном записи хранятся последовательно, но доступ к ним осуществляется напрямую с помощью индекса. .

iii) последовательная организация файлов

Записи в файле хранятся и доступны друг за другом на носителе данных

iv) Индексированный последовательный метод организации файлов

Аналогично последовательному методу, только индекс используется для того, чтобы компьютер мог находить отдельные записи на носителе.

РЕЖИМЫ ОБРАБОТКИ ЭЛЕКТРОННЫХ ДАННЫХ
Это способы, которыми компьютер под влиянием операционной системы предназначен для обработки данных, например
a) Пакетная обработка - это выполнение ряда заданий в программа на компьютере без ручного вмешательства (неинтерактивная). Строго говоря, это режим обработки: выполнение серии программ, каждая из которых работает с набором или «пакетом» входных данных, а не с одним вводом (который вместо этого был бы пользовательским заданием). ). Однако это различие в значительной степени утеряно, и ряд шагов в пакетном процессе часто называют "заданием" или "пакетным заданием".

Пакетная обработка имеет следующие преимущества:=

Это может сместить время обработки задания на период, когда вычислительные ресурсы менее загружены.
Это позволяет избежать простоя вычислительных ресурсов благодаря ежеминутному ручному вмешательству и контролю.
Поддерживая высокий общий коэффициент использования, он амортизирует компьютер, особенно дорогой.
Это позволяет системе использовать разные приоритеты для интерактивной и неинтерактивной работы.
Вместо того, чтобы запускать одну программу несколько раз для обработки одной транзакции каждый раз, пакетные процессы будут запускать программу только один раз для многих транзакций, что снижает нагрузку на систему.

Недостатки
: пользователи не могут завершить процесс во время выполнения и должны ждать завершения выполнения.

Обработка данных — это метод манипулирования данными. Это означает преобразование необработанных данных в осмысленный и машиночитаемый контент. По сути, это процесс преобразования необработанных данных в значимую информацию.«Это может относиться к использованию автоматизированных методов для обработки коммерческих данных». Как правило, при этом используются относительно простые повторяющиеся действия для обработки больших объемов схожей информации. Необработанные данные – это входные данные, которые подвергаются какой-либо обработке для получения значимых результатов.

Типы обработки данных

Существуют различные методы обработки данных в зависимости от того, для чего они нужны. В этой статье мы обсудим пять основных типов обработки данных.

Под коммерческой обработкой данных понимается метод применения стандартных реляционных баз данных, включающий использование пакетной обработки. Это включает в себя предоставление огромных данных в качестве входных данных в систему и создание большого объема выходных данных, но с использованием меньшего количества вычислительных операций. В основном он сочетает в себе коммерцию и компьютеры, что делает его полезным для бизнеса. Данные, которые обрабатываются в этой системе, обычно стандартизированы, поэтому вероятность ошибок гораздо ниже.

Многие ручные работы автоматизированы с помощью компьютеров, чтобы сделать их простыми и безошибочными. Компьютеры используются в бизнесе для получения необработанных данных и их обработки в форме информации, полезной для бизнеса. Бухгалтерские программы являются прототипами приложений для обработки данных. Информационная система (ИС) – это область, изучающая, например, компьютерные системы организаций.

2.Обработка научных данных

В отличие от коммерческой обработки данных, научная обработка данных предполагает большое использование вычислительных операций, но меньшие объемы входных и выходных данных. К вычислительным операциям относятся арифметические операции и операции сравнения. В этом типе обработки любая вероятность ошибок недопустима, поскольку это может привести к принятию ошибочных решений. Следовательно, процесс проверки, сортировки и стандартизации данных осуществляется очень тщательно, и используется широкий спектр научных методов, чтобы гарантировать отсутствие неверных соотношений и выводов.

Это занимает больше времени, чем коммерческая обработка данных. Общие примеры обработки научных данных включают обработку, управление и распространение продуктов научных данных, а также упрощение научного анализа алгоритмов, данных калибровки и продуктов данных, а также поддержание всего программного обеспечения и данных калибровки под строгим контролем конфигурации.

Пакетная обработка — тип обработки данных, при котором несколько случаев обрабатываются одновременно. Данные собираются и обрабатываются партиями и в основном используются, когда данные однородны и в больших количествах. Пакетная обработка может быть определена как параллельное, одновременное или последовательное выполнение действия. Одновременная пакетная обработка происходит, когда они выполняются одним и тем же ресурсом для всех случаев одновременно. Последовательная пакетная обработка происходит, когда они выполняются одним и тем же ресурсом для разных случаев сразу или сразу друг за другом.

Параллельная пакетная обработка означает, что они выполняются одними и теми же ресурсами, но частично перекрываются во времени. Он используется в основном в финансовых приложениях или там, где требуются дополнительные уровни безопасности. В этой обработке время вычислений относительно меньше, потому что применение функции ко всем данным в целом извлекает выходные данные. Он может выполнять работу с минимальным вмешательством человека.

На языке современных систем баз данных «онлайн» означает «интерактивный», в пределах терпения». Онлайн-обработка противоположна «пакетной» обработке. Онлайн-обработка может быть построена из ряда относительно более простых операторов, подобно тому, как строятся традиционные механизмы обработки запросов. Онлайн-обработка Аналитические операции обычно включают в себя большую часть больших баз данных. Поэтому неудивительно, что современные онлайн-аналитические системы обеспечивают интерактивную работу. Секрет их успеха — предварительные вычисления.

В большинстве систем интерактивной аналитической обработки ответ на каждую точку и щелчок вычисляется задолго до того, как пользователь запустит приложение. На самом деле, многие системы онлайн-обработки выполняют эти вычисления относительно неэффективно, но, поскольку обработка выполняется заранее, конечный пользователь не видит проблемы с производительностью. Этот тип обработки используется, когда данные должны обрабатываться непрерывно, и они автоматически загружаются в систему.

Существующая система управления данными обычно ограничивает возможности обработки данных в зависимости от того, как и когда, поскольку эта система всегда основана на периодическом обновлении пакетов, из-за чего возникает многочасовая задержка в возникновении события и записи или обновить его. Это вызвало потребность в системе, которая могла бы записывать, обновлять и обрабатывать данные по мере поступления, т.е.в режиме реального времени, что помогло бы сократить временную задержку между появлением и обработкой почти до нуля. Огромные объемы данных передаются в системы организаций, поэтому их хранение и обработка в режиме реального времени изменили бы ситуацию.

Большинство организаций хотят иметь представление о данных в режиме реального времени, чтобы полностью понимать среду внутри или за пределами своей организации. Именно здесь возникает потребность в системе, способной обрабатывать и анализировать данные в режиме реального времени. Этот тип обработки дает результаты по мере того, как это происходит. Самый распространенный метод — брать данные непосредственно из источника, который также может называться потоком, и делать выводы без их фактической передачи или загрузки. Еще одним важным методом обработки в реальном времени являются методы виртуализации данных, когда значимая информация извлекается для нужд обработки данных, в то время как данные остаются в исходной форме.

Распределенная обработка данных (DDP) – это метод разделения больших наборов данных и их хранения на нескольких компьютерах или серверах. В этом типе обработки задача распределяется между несколькими ресурсами/машинами и выполняется параллельно, а не синхронно и выстраивается в очередь. Поскольку данные обрабатываются за более короткий период, это более рентабельно для предприятий и позволяет им двигаться быстрее. Кроме того, отказоустойчивость распределенной системы обработки данных чрезвычайно высока.

Многопроцессорность – это тип обработки данных, при котором два или более процессора одновременно работают с одним и тем же набором данных. При этом несколько процессоров размещены в одной системе. Данные разбиваются на кадры, и каждый кадр обрабатывается двумя или более процессорами в одной компьютерной системе, и все они работают параллельно.

В этом типе обработки центральный процессор (ЦП) большого цифрового компьютера почти одновременно взаимодействует с несколькими пользователями с различными программами. Во время процесса ввода-вывода можно решить несколько дискретных проблем, поскольку ЦП значительно быстрее большинства периферийных устройств (например, принтеров и видеотерминалов). ЦП последовательно решает проблему каждого пользователя, но у удаленных терминалов создается впечатление, что доступ к системе с разделением времени и извлечение из нее происходят мгновенно, поскольку решения доступны немедленно, как только проблема полностью введена.

Заключение

Это базовое введение в концепцию обработки данных и ее пять основных типов. Все типы были кратко обсуждены, и все эти методы имеют свое значение в соответствующих областях, но кажется, что в сегодняшней динамичной среде системы обработки в реальном времени и онлайн-системы будут наиболее широко использоваться.

Если вы заинтересованы в построении карьеры в области науки о данных, наша 9-месячная (онлайн-сеансы) программа последипломного образования по науке о данных и машинному обучению может очень помочь вам стать успешным специалистом в области науки о данных.

ТАКЖЕ ПРОЧИТАЙТЕ

различные типы обработки данных методы обработки данных типы обработки данных типы системы обработки данных типы обработки

Несмотря на то, что были приложены все усилия для соблюдения правил стиля цитирования, могут быть некоторые расхождения. Если у вас есть какие-либо вопросы, обратитесь к соответствующему руководству по стилю или другим источникам.

Наши редакторы рассмотрят то, что вы отправили, и решат, нужно ли пересматривать статью.

обработка информации, получение, запись, организация, поиск, отображение и распространение информации. В последние годы этот термин часто применялся конкретно к компьютерным операциям.

В популярном использовании термин информация относится к фактам и мнениям, предоставленным и полученным в ходе повседневной жизни: человек получает информацию непосредственно от других живых существ, из средств массовой информации, из электронных банков данных, и от всевозможных наблюдаемых явлений в окружающей среде. Человек, использующий такие факты и мнения, генерирует больше информации, часть которой сообщается другим в ходе дискурса, в инструкциях, в письмах и документах, а также через другие средства массовой информации. Информация, организованная в соответствии с некоторыми логическими отношениями, называется совокупностью знаний, которые должны быть получены путем систематического воздействия или изучения. Применение знаний (или навыков) дает опыт, а дополнительные аналитические или эмпирические идеи, как говорят, представляют собой примеры мудрости.Использование термина информация не ограничивается исключительно ее передачей посредством естественного языка. Информация также регистрируется и передается с помощью искусства, мимики и жестов или таких других физических реакций, как дрожь. Более того, каждое живое существо наделено информацией в виде генетического кода. Эти информационные явления пронизывают физический и ментальный мир, и их разнообразие таково, что до сих пор бросало вызов всем попыткам единого определения информации.

Интерес к информационным явлениям резко возрос в 20 веке, и сегодня они являются объектами изучения в ряде дисциплин, включая философию, физику, биологию, лингвистику, информатику и информатику, электронную и коммуникационную инженерию, науку об управлении, и социальные науки. С коммерческой точки зрения индустрия информационных услуг стала одной из самых новых отраслей во всем мире. Почти все остальные отрасли — производство и обслуживание — все больше озабочены информацией и ее обработкой. Различные, хотя и часто пересекающиеся, точки зрения и явления в этих областях приводят к различным (а иногда и противоречивым) концепциям и «определениям» информации.

В этой статье затрагиваются такие понятия, связанные с обработкой информации. Рассматривая основные элементы обработки информации, он различает информацию в аналоговой и цифровой форме и описывает ее получение, запись, организацию, поиск, отображение и методы распространения. Отдельная статья, информационная система, посвящена методам организационного контроля и распространения информации.

Общие соображения

Основные понятия

Интерес к тому, как передается информация и как ее носители передают смысл, со времен досократических философов занимал область исследования, называемую семиотикой, изучением знаков и знаковых явлений. Знаки являются нередуцируемыми элементами коммуникации и носителями смысла. Американскому философу, математику и физику Чарльзу С. Пирсу приписывают указание на три измерения знаков, которые связаны соответственно с телом или средой знака, объектом, который знак обозначает, и интерпретантом или интерпретантом. толкование знака. Пирс признал, что фундаментальные отношения информации по существу триадны; напротив, все отношения физических наук сводятся к диадическим (бинарным) отношениям. Другой американский философ, Чарльз У. Моррис, назвал эти три знаковых измерения синтаксическим, семантическим и прагматическим — имена, под которыми они известны сегодня.

Информационные процессы выполняются информационными процессорами. Для данного информационного процессора, физического или биологического, токен — это объект, лишенный смысла, который процессор распознает как полностью отличный от других токенов. Группа таких уникальных токенов, распознаваемых процессором, составляет его основной «алфавит»; например, точка, тире и пробел составляют основной алфавит символов процессора азбуки Морзе. Объекты, несущие значение, представлены наборами токенов, называемых символами. Последние объединяются для формирования символьных выражений, которые являются входными данными или выходными данными информационных процессов и хранятся в памяти процессора.

Информационные процессоры — это компоненты информационной системы, представляющей собой класс конструкций. Абстрактная модель информационной системы включает четыре основных элемента: процессор, память, рецептор и эффектор (рис. 1). У процессора есть несколько функций: (1) выполнять элементарные информационные процессы над символьными выражениями, (2) временно хранить в кратковременной памяти процессора входные и выходные выражения, над которыми работают эти процессы и которые они генерируют, (3) планировать выполнение этих процессов и (4) изменять эту последовательность операций в соответствии с содержимым кратковременной памяти. В памяти хранятся символьные выражения, в том числе те, которые представляют составные информационные процессы, называемые программами. Два других компонента, рецептор и эффектор, представляют собой механизмы ввода и вывода, функции которых заключаются, соответственно, в получении символических выражений или стимулов из внешней среды для обработки процессором и в передаче обработанных структур обратно в окружающую среду.

Мощность этой абстрактной модели системы обработки информации обеспечивается способностью составляющих ее процессоров выполнять небольшое количество элементарных информационных процессов: чтение; сравнение; создание, изменение и наименование; копирование; хранение; и писать. Модель, представляющая широкий спектр таких систем, оказалась полезной для объяснения искусственных информационных систем, реализованных на последовательных информационных процессорах.

Поскольку было признано, что в природе информационные процессы не являются строго последовательными, с 1980 года все большее внимание уделяется изучению человеческого мозга как информационного процессора параллельного типа. Когнитивные науки, междисциплинарная область, занимающаяся изучением человеческого разума, внесли свой вклад в развитие нейрокомпьютеров, нового класса параллельных процессоров с распределенной информацией, которые имитируют функционирование человеческого мозга, включая его возможности самоконтроля. организация и обучение. Так называемые нейронные сети, представляющие собой математические модели, вдохновленные сетью нейронных цепей человеческого мозга, все чаще находят применение в таких областях, как распознавание образов, управление производственными процессами и финансами, а также во многих исследовательских дисциплинах.

Информация как ресурс и товар

В конце 20 века информация приобрела два основных утилитарных значения. С одной стороны, он считается экономическим ресурсом, наравне с другими ресурсами, такими как труд, материал и капитал. Эта точка зрения основана на доказательствах того, что обладание информацией, ее манипулирование и использование могут повысить рентабельность многих физических и когнитивных процессов. Рост активности обработки информации в промышленном производстве, а также в решении человеческих проблем был замечательным. Анализ одного из трех традиционных секторов экономики, сферы услуг, показывает резкий рост информационно-емкой деятельности с начала 20 века. К 1975 году на эти виды деятельности приходилось половина рабочей силы Соединенных Штатов.

Как индивидуальный и общественный ресурс, информация имеет некоторые интересные характеристики, которые отличают ее от традиционных представлений об экономических ресурсах. В отличие от других ресурсов, информация обширна, и ее ограничения, по-видимому, накладываются только временем и когнитивными способностями человека. Его экспансивность объясняется следующим: (1) он естественным образом распространяется, (2) он воспроизводится, а не потребляется посредством использования, и (3) им можно только делиться, а не обмениваться в транзакциях. В то же время информация сжимаема как синтаксически, так и семантически. В сочетании с его способностью заменять другие экономические ресурсы, его транспортабельностью на очень высоких скоростях и его способностью давать преимущества обладателю информации, эти характеристики лежат в основе таких социальных отраслей, как исследования, образование, издательское дело, маркетинг, и даже политика. Забота общества об экономии информационных ресурсов вышла за пределы традиционной области библиотек и архивов и теперь охватывает организационную, институциональную и государственную информацию под эгидой управления информационными ресурсами.

Независимо от того, используете ли вы Интернет для изучения определенной темы, совершения финансовых транзакций в Интернете, заказа еды и т. д., данные генерируются каждую секунду. Использование социальных сетей, онлайн-покупок и сервисов потокового видео увеличило объем данных. По оценкам исследования Domo, в 2020 году каждую секунду создается 1,7 МБ данных для каждого человека на планете. Чтобы использовать такой огромный объем данных и получать ценную информацию, в игру вступает обработка данных.

Двигаясь вперед, давайте разберемся, что такое обработка данных.

Что такое обработка данных?

Данные в необработанном виде бесполезны для любой организации. Обработка данных — это метод сбора необработанных данных и преобразования их в полезную информацию. Обычно это выполняется в виде пошагового процесса командой специалистов по данным и инженеров по данным в организации. Необработанные данные собираются, фильтруются, сортируются, обрабатываются, анализируются, сохраняются, а затем представляются в удобном для чтения формате.

Обработка данных необходима организациям для разработки более эффективных бизнес-стратегий и повышения их конкурентоспособности. Преобразовывая данные в удобочитаемый формат, такой как графики, диаграммы и документы, сотрудники всей организации могут понимать и использовать данные.

Последипломная программа по инженерии данных

Теперь, когда мы поняли, что такое обработка данных, давайте разберемся с ее циклическим процессом.

Цикл обработки данных

Цикл обработки данных состоит из ряда шагов, на которых необработанные данные (входные данные) передаются в процесс (ЦП) для получения полезных сведений (выходные данные). Каждый шаг выполняется в определенном порядке, но весь процесс повторяется циклически. Выходные данные первого цикла обработки данных можно сохранить и использовать в качестве входных данных для следующего цикла.

Рис. Цикл обработки данных (источник)

Как правило, цикл обработки данных состоит из шести основных этапов:

Шаг 1. Сбор

Шаг 2. Подготовка

Подготовка или очистка данных — это процесс сортировки и фильтрации необработанных данных для удаления ненужных и неточных данных. Исходные данные проверяются на наличие ошибок, дублирования, просчетов или отсутствующих данных и преобразуются в подходящую форму для дальнейшего анализа и обработки. Это делается для того, чтобы в процессор поступало только данные самого высокого качества.

Шаг 3: ввод

На этом этапе необработанные данные преобразуются в машиночитаемую форму и передаются в процессор. Это может быть ввод данных с помощью клавиатуры, сканера или любого другого источника ввода.

Шаг 4. Обработка данных

На этом этапе необработанные данные подвергаются различным методам обработки с использованием алгоритмов машинного обучения и искусственного интеллекта для получения желаемого результата. Этот шаг может немного отличаться от процесса к процессу в зависимости от источника обрабатываемых данных (озера данных, онлайн-базы данных, подключенные устройства и т. д.) и предполагаемого использования выходных данных.

Шаг 5. Вывод

Данные, наконец, передаются и отображаются пользователю в удобочитаемой форме, такой как графики, таблицы, векторные файлы, аудио, видео, документы и т. д. Эти выходные данные могут быть сохранены и обработаны в следующем цикле обработки данных.

Шаг 6. Хранение

Последним этапом цикла обработки данных является хранение, где данные и метаданные сохраняются для дальнейшего использования. Это обеспечивает быстрый доступ и извлечение информации, когда это необходимо, а также позволяет напрямую использовать ее в качестве входных данных в следующем цикле обработки данных.

Бесплатный курс: Разработчик больших данных Hadoop и Spark

Теперь, когда мы узнали, что такое обработка данных и ее цикл, теперь мы можем рассмотреть типы.

Типы обработки данных

Существуют различные типы обработки данных в зависимости от источника данных и шагов, предпринимаемых блоком обработки для создания выходных данных. Не существует универсального метода обработки необработанных данных.

Данные собираются и обрабатываются пакетами. Используется для больших объемов данных.

Например: система начисления заработной платы

Данные обрабатываются в течение нескольких секунд после ввода. Используется для небольших объемов данных.

Например: снятие денег в банкомате

Данные автоматически загружаются в ЦП, как только они становятся доступными. Используется для непрерывной обработки данных.

Например: сканирование штрих-кода

Данные разбиваются на кадры и обрабатываются с использованием двух или более ЦП в рамках одной компьютерной системы. Также называется параллельной обработкой.

Например: прогноз погоды

Выделяет компьютерные ресурсы и данные во временных интервалах нескольким пользователям одновременно.

Методы обработки данных

Существует три основных метода обработки данных: ручной, механический и электронный.

Ручная обработка данных

В этом методе обработки данные обрабатываются вручную. Весь процесс сбора данных, фильтрации, сортировки, расчета и других логических операций выполняется с участием человека без использования какого-либо другого электронного устройства или программного обеспечения для автоматизации. Это недорогой метод, практически не требующий инструментов, но приводящий к большому количеству ошибок, высоким трудозатратам и большим затратам времени.

Механическая обработка данных

Данные обрабатываются механически с помощью устройств и машин. Это могут быть простые устройства, такие как калькуляторы, пишущие машинки, печатный станок и т. д. С помощью этого метода можно выполнять простые операции обработки данных. Он дает гораздо меньше ошибок, чем ручная обработка данных, но увеличение объема данных сделало этот метод более сложным и трудным.

Изучайте науку о данных с помощью R БЕСПЛАТНО

Электронная обработка данных

Данные обрабатываются современными технологиями с использованием программного обеспечения и программ для обработки данных. Программному обеспечению дается набор инструкций для обработки данных и получения вывода. Этот метод является самым дорогим, но обеспечивает самые высокие скорости обработки с высочайшей надежностью и точностью вывода.

Примеры обработки данных

Обработка данных происходит в нашей повседневной жизни независимо от того, знаем мы об этом или нет. Вот несколько реальных примеров обработки данных:

Программное обеспечение для торговли акциями, которое преобразует миллионы данных об акциях в простой график.
Компания, занимающаяся электронной торговлей, использует историю поиска клиентов, чтобы рекомендовать похожие товары.
Компания, занимающаяся цифровым маркетингом, использует демографические данные людей для разработки стратегии кампаний с учетом местоположения.
Автономный автомобиль использует данные датчиков в режиме реального времени, чтобы определять, есть ли на дороге пешеходы и другие автомобили.

Это все, что касается статьи о том, что такое обработка данных.

Хотите начать карьеру инженера по работе с большими данными? Посетите учебный курс для инженеров по работе с большими данными и получите сертификат.

Что вы можете сделать дальше

Данные содержат много полезной информации для организаций, исследователей, учреждений и отдельных пользователей. С увеличением объема данных, генерируемых каждый день, возникает потребность в большем количестве ученых и инженеров данных, которые помогут понять эти данные. Сертификационный курс Simplilearn Data Engineering Certification Course в сотрудничестве с IBM и Университетом Purdue предлагает высочайший уровень обучения, который поможет вам овладеть важнейшими навыками обработки данных. Эта программа, основанная на академическом превосходстве Университета Пердью в области инженерии данных и практическом опыте обучения IBM, поможет ускорить вашу карьеру в качестве специалиста по обработке данных.

Надеюсь, вам понравилась статья «что такое обработка данных». В случае сомнений задавайте свои вопросы в разделе комментариев.

Найдите наш онлайн-учебный курс для аспирантов по инженерии данных в лучших городах:

Имя	Дата	Место
Программа последипломного образования в Data Engineering	Когорта начинается 5 апреля 2022 г., Группа выходного дня	Ваш город	Подробнее
Программа последипломного образования в области инженерии данных	Когорта начинается 19 апреля 2022 г., группа выходного дня	Ваш город	Просмотреть подробности< /td>
Программа последипломного образования в области инженерии данных	Когорта начинается 6 мая 2022 г., Группа выходного дня	Ваш город	Подробнее

Об авторе

Никита Дуггал

Никита Дуггал — увлеченный цифровой кочевник, специализирующийся на английском языке и литературе, знаток слов, который любит писать о бушующих технологиях, цифровом маркетинге и карьерных загадках.

Читайте также: