Информация, которую обрабатывает компьютер, называется
Обновлено: 21.11.2024
В вычислительной технике процесс — это экземпляр компьютерной программы, который выполняется. Он содержит код программы и ее текущую активность. В зависимости от операционной системы (ОС) процесс может состоять из нескольких потоков выполнения, выполняющих инструкции одновременно. [ 1 ] [ 2 ]
Компьютерная программа — это пассивный набор инструкций; процесс - это фактическое выполнение этих инструкций. С одной и той же программой может быть связано несколько процессов; например, открытие нескольких экземпляров одной и той же программы часто означает выполнение нескольких процессов.
Многозадачность – это метод, позволяющий нескольким процессам совместно использовать процессоры (ЦП) и другие системные ресурсы. Каждый ЦП одновременно выполняет одну задачу. Однако многозадачность позволяет каждому процессору переключаться между выполняемыми задачами, не дожидаясь завершения каждой задачи. В зависимости от реализации операционной системы переключение может выполняться, когда задачи выполняют операции ввода/вывода, когда задача указывает, что ее можно переключить, или при аппаратных прерываниях.
Распространенной формой многозадачности является разделение времени. Разделение времени — это метод, позволяющий быстро реагировать на интерактивные пользовательские приложения. В системах с разделением времени переключение контекста выполняется быстро. Это создает впечатление, что несколько процессов выполняются одновременно на одном процессоре. Выполнение нескольких процессов, казалось бы, одновременное, называется параллелизмом.
Из соображений безопасности и надежности большинство современных операционных систем запрещают прямую связь между независимыми процессами, обеспечивая строго опосредованные и контролируемые функции межпроцессного взаимодействия.
Содержание
Представление
Как правило, процесс компьютерной системы состоит из (или, как говорят, «принадлежит») следующих ресурсов:
- изображение исполняемого машинного кода, связанного с программой.
- Память (обычно часть виртуальной памяти); который включает исполняемый код, данные процесса (входные и выходные), стек вызовов (для отслеживания активных подпрограмм и/или других событий) и кучу для хранения промежуточных данных вычислений, сгенерированных во время выполнения.
- Дескрипторы ресурсов операционной системы, выделенные процессу, такие как файловые дескрипторы (терминология Unix) или дескрипторы (Windows), а также источники данных и приемники. атрибуты, такие как владелец процесса и набор разрешений процесса (разрешенные операции). состояние (контекст), такое как содержимое регистров, адресация физической памяти и т. д. состояние обычно сохраняется в регистрах компьютера, когда процесс выполняется, и в памяти в противном случае. [ 1 ]
Операционная система хранит большую часть этой информации об активных процессах в структурах данных, называемых блоками управления процессами
Любое подмножество ресурсов, но обычно по крайней мере состояние процессора, может быть связано с каждым из потоков процесса в операционных системах, которые поддерживают потоки или «дочерние» процессы.
Операционная система разделяет свои процессы и выделяет необходимые им ресурсы, чтобы они с меньшей вероятностью мешали друг другу и вызывали системные сбои (например, взаимоблокировку или перегрузку). Операционная система также может предоставлять механизмы межпроцессного взаимодействия, позволяющие процессам взаимодействовать безопасным и предсказуемым образом.
Управление процессами в многозадачных операционных системах
Многозадачная* операционная система может просто переключаться между процессами, чтобы создать видимость одновременного или одновременного выполнения многих процессов, хотя на самом деле только один процесс может выполняться в любой момент времени на одноядерном процессоре (если только не используется многопоточность). или другая подобная технология). [ 3 ]
Обычно один процесс связывается с основной программой, а «дочерние» («дочерние») процессы — с любыми побочными, параллельными процессами, которые ведут себя как асинхронные подпрограммы. Говорят, что процесс владеет ресурсами, одним из которых является образ его программы (в памяти). (Обратите внимание, однако, что в многопроцессорных системах многие процессы могут запускаться или совместно использовать одну и ту же реентерабельную программу в одном и том же месте в памяти, но считается, что каждый процесс владеет своим собственным изображение программы.)
Процессы часто называют задачами во встроенных операционных системах. Смысл «процесса» (или задачи) — это «что-то, что требует времени», в отличие от «памяти», которая представляет собой «что-то, что занимает место». (Исторически термины «задача» и «процесс» использовались как синонимы, но термин «задача», похоже, исчезает из компьютерного лексикона.)
Приведенное выше описание применимо как к процессам, управляемым операционной системой, так и к процессам, определенным исчислениями процессов.
Если процесс запрашивает что-то, чего он должен ждать, он будет заблокирован.Когда процесс находится в заблокированном состоянии, он имеет право на подкачку на диск, но это прозрачно в системе виртуальной памяти, где блоки значений памяти могут находиться на самом деле на диске, а не в основной памяти в любое время. Обратите внимание, что даже неиспользуемые части активных процессов/задач (выполняемых программ) можно выгрузить на диск. Все части исполняемой программы и ее данные не обязательно должны находиться в физической памяти, чтобы связанный процесс был активным.
*Задачи и процессы по сути относятся к одному и тому же объекту. И хотя у них несколько разная терминологическая история, они стали использоваться как синонимы. Сегодня термин «процесс» обычно предпочтительнее задачи, за исключением, когда речь идет о «многозадачности», поскольку альтернативный термин «многопроцессорность» слишком легко спутать с многопроцессорным (то есть компьютером с двумя или больше процессоров).
Состояния процесса
Различные состояния процесса отображаются на диаграмме состояний со стрелками, указывающими на возможные переходы между состояниями.
Ядру операционной системы, поддерживающему многозадачность, необходимо, чтобы процессы находились в определенных состояниях. Имена для этих состояний не стандартизированы, но имеют схожую функциональность. [ 1 ]
- Сначала процесс "создается" - он загружается со вторичного запоминающего устройства (жесткий диск или компакт-диск) в основную память. После этого планировщик процесса присваивает ему состояние "ожидание".
- Пока процесс «ожидает», он ожидает, пока планировщик выполнит так называемое переключение контекста и загрузит процесс в процессор. Затем состояние процесса становится «выполняется», и процессор выполняет инструкции процесса.
- Если процессу необходимо дождаться ресурса (ожидания ввода данных пользователем или открытия файла), ему присваивается состояние "заблокировано". Состояние процесса снова меняется на "ожидание", когда процесс больше не нуждается в ожидании.
- После того, как процесс завершает выполнение или прерывается операционной системой, он больше не нужен. Процесс мгновенно удаляется или переводится в состояние «завершен». При удалении он просто ожидает удаления из основной памяти. [ 1 ][ 4 ]
Взаимодействие между процессами
Взаимодействие процессов друг с другом называется "межпроцессное взаимодействие" (IPC). Процессам часто необходимо обмениваться данными, например, в конвейере оболочки выходные данные первого процесса должны передаваться второму и так далее другому процессу. Желательно, чтобы это было хорошо структурировано, без использования прерываний.
Возможно даже, что два процесса будут выполняться на разных машинах. Операционная система (ОС) может отличаться от одного процесса к другому, поэтому необходимы некоторые посредники (называемые протоколами).
История
К началу 60-х годов программное обеспечение для управления компьютером эволюционировало от программного обеспечения для управления монитором, например IBSYS, до программного обеспечения для исполнительного управления. Компьютеры стали «быстрее», а компьютерное время по-прежнему не было ни «дешевым», ни полностью использованным. Это сделало мультипрограммирование возможным и необходимым.
Мультипрограммирование означает, что несколько программ работают "одновременно" (одновременно). Сначала они работали на одном процессоре (т. е. однопроцессорном) и разделяли скудные ресурсы. Мультипрограммирование также является базовой формой многопроцессорной обработки, но гораздо более широким термином.
Программы состоят из последовательности инструкций для процессора. Один процессор может одновременно выполнять только одну команду. Поэтому невозможно запускать больше программ одновременно. Программе может потребоваться некоторый ресурс (вход . ), который имеет «большую» задержку. Программа также может начать какую-то медленную операцию (вывод на принтер . ). Все это приводит к тому, что процессор «простаивает» (не используется). Чтобы использовать процессор все время, выполнение такой программы было остановлено. В этот момент была запущена или перезапущена вторая (или n-я) программа. Пользователь понял, что программы выполняются «одновременно» (отсюда и термин одновременно).
Вскоре после этого понятие «программа» было расширено до понятия «выполняемая программа и ее контекст». Так родилась концепция процесса.
Это стало необходимо с изобретением реентерабельного кода.
Треды появились несколько позже. Однако с появлением разделения времени; компьютерные сети; многопроцессорные компьютеры с общей памятью; и т. д., старое «мультипрограммирование» уступило место настоящей многозадачности, многопроцессорности и, позднее, многопоточности.
Компьютер — это машина для обработки информации. Компьютеры обрабатывают данные для получения информации.
Наборы инструкций, которые люди дают компьютерам, называются программами или программным обеспечением.
Программное обеспечение, которое выполняет определенный тип задач для пользователя, часто называют прикладным программным обеспечением.
Есть много причин для использования компьютеров:
- Компьютеры могут работать намного быстрее людей;
- Компьютеры никогда не устают и не нуждаются в отдыхе.
- Компьютеры могут выполнять работу, которую человеку было бы опасно выполнять;
- Компьютеры могут хранить большие объемы информации на очень маленьком пространстве.
- Компьютеры могут очень быстро находить информацию;
- Компьютеры никогда не теряют и не помещают информацию не на место.
Три стадии вычислений: ввод, обработка и вывод.
Компьютер проходит через эти этапы, «запуская» программу. Программа — это набор пошаговых инструкций, которые точно сообщают компьютеру, что делать с входными данными, чтобы получить требуемый результат.
- Этот этап вычислений связан с передачей данных, необходимых программе, в компьютер.
- Для этого используются устройства ввода.
- Наиболее часто используемыми устройствами ввода являются мышь и клавиатура.
- Инструкции о том, что делать с входными данными, содержатся в программе.
- Во время обработки компьютер следует этим инструкциям, используя только что введенные данные.
- То, что компьютер производит в конце этого этапа, называется выводом.
- Этот этап вычислений связан с представлением обработанных данных в виде информации в удобной для пользователя форме.
- Для этого используются устройства вывода.
- Наиболее часто используемыми устройствами вывода являются экран, который также называется монитором или визуальным дисплеем (VDU), и принтер.
- Данные – это любой набор чисел, символов или других символов, закодированный в формате, который можно вводить в компьютер и обрабатывать.
- Данные сами по себе не имеют значения или контекста.
- Только после обработки компьютером данные обретают контекст и становятся информацией.
- Существует много типов данных
- Все данные в конечном итоге хранятся в виде набора чисел внутри компьютера.
- Данные могут быть введены пользователем в компьютер разными способами.
- К основным типам данных, которые можно вводить в компьютер и обрабатывать, относятся числовые данные, текст, даты, графика и звук.
Системы обработки данных
В этом видео рассматриваются системы обработки данных
- Оборудование — это название, которое дается любой части компьютера, к которой вы можете прикоснуться.
- Отдельное оборудование называется устройством.
- Основное аппаратное обеспечение любого компьютера состоит из центрального процессора (ЦП), а также устройств ввода, вывода и вспомогательных устройств хранения.
Центральный процессор (CPU)
- Это часть компьютера, где происходит поиск и сортировка данных, вычисления и принятие решений.
- ЦП содержит основную память, блок управления и арифметико-логическое устройство (ALU).
Введение в процессоры
В этом видео объясняются части процессора и функции каждой части. Центральный процессор содержит арифметико-логический блок, выполняющий все арифметические операции, а также функции И/ИЛИ, и блок управления, в котором принимаются решения о сборе и отправке данных.
Раздел 404 Закона Сарбейнса-Оксли (SOX) требует, чтобы все публичные компании установили внутренний контроль и процедуры.
Закон о защите конфиденциальности детей в Интернете от 1998 года (COPPA) – это федеральный закон, который налагает особые требования на операторов доменов .
План North American Electric Reliability Corporation по защите критически важной инфраструктуры (NERC CIP) представляет собой набор стандартов.
Стандарт безопасности данных платежных приложений (PA-DSS) – это набор требований, призванных помочь поставщикам программного обеспечения в разработке безопасных .
Взаимная аутентификация, также называемая двусторонней аутентификацией, представляет собой процесс или технологию, в которой оба объекта обмениваются данными .
Экранированная подсеть или брандмауэр с тройным подключением относится к сетевой архитектуре, в которой один брандмауэр используется с тремя сетями .
Медицинская транскрипция (МТ) – это ручная обработка голосовых сообщений, продиктованных врачами и другими медицинскими работниками.
Электронное отделение интенсивной терапии (eICU) — это форма или модель телемедицины, в которой используются самые современные технологии.
Защищенная медицинская информация (PHI), также называемая личной медицинской информацией, представляет собой демографическую информацию, медицинскую .
Снижение рисков – это стратегия подготовки к угрозам, с которыми сталкивается бизнес, и уменьшения их последствий.
Отказоустойчивая технология — это способность компьютерной системы, электронной системы или сети обеспечивать бесперебойное обслуживание.
Синхронная репликация — это процесс копирования данных по сети хранения, локальной или глобальной сети, поэтому .
Коэффициент усиления записи (WAF) – это числовое значение, представляющее объем данных, передаваемых контроллером твердотельного накопителя (SSD) .
API облачного хранилища — это интерфейс прикладного программирования, который соединяет локальное приложение с облачным хранилищем.
Интерфейс управления облачными данными (CDMI) – это международный стандарт, определяющий функциональный интерфейс, используемый приложениями.
Независимо от того, используете ли вы Интернет для изучения определенной темы, совершения финансовых транзакций в Интернете, заказа еды и т. д., данные генерируются каждую секунду. Использование социальных сетей, онлайн-покупок и сервисов потокового видео увеличило объем данных. По оценкам исследования Domo, в 2020 году каждую секунду создается 1,7 МБ данных для каждого человека на планете. Чтобы использовать такой огромный объем данных и получать ценную информацию, в игру вступает обработка данных.
Двигаясь вперед, давайте разберемся, что такое обработка данных.
Что такое обработка данных?
Данные в необработанном виде бесполезны для любой организации. Обработка данных — это метод сбора необработанных данных и преобразования их в полезную информацию. Обычно это выполняется в виде пошагового процесса командой специалистов по данным и инженеров по данным в организации. Необработанные данные собираются, фильтруются, сортируются, обрабатываются, анализируются, сохраняются, а затем представляются в удобном для чтения формате.
Обработка данных необходима организациям для разработки более эффективных бизнес-стратегий и повышения их конкурентоспособности. Преобразовывая данные в удобочитаемый формат, такой как графики, диаграммы и документы, сотрудники всей организации могут понимать и использовать данные.
Последипломная программа по инженерии данных
Теперь, когда мы поняли, что такое обработка данных, давайте разберемся с ее циклическим процессом.
Цикл обработки данных
Цикл обработки данных состоит из ряда шагов, на которых необработанные данные (входные данные) передаются в процесс (ЦП) для получения полезных сведений (выходные данные). Каждый шаг выполняется в определенном порядке, но весь процесс повторяется циклически. Выходные данные первого цикла обработки данных можно сохранить и использовать в качестве входных данных для следующего цикла.
Рис. Цикл обработки данных (источник)
Как правило, цикл обработки данных состоит из шести основных этапов:
Шаг 1. Сбор
Шаг 2. Подготовка
Подготовка или очистка данных — это процесс сортировки и фильтрации необработанных данных для удаления ненужных и неточных данных. Исходные данные проверяются на наличие ошибок, дублирования, просчетов или отсутствующих данных и преобразуются в подходящую форму для дальнейшего анализа и обработки. Это делается для того, чтобы в процессор поступало только данные самого высокого качества.
Шаг 3: ввод
На этом этапе необработанные данные преобразуются в машиночитаемую форму и передаются в процессор. Это может быть ввод данных с помощью клавиатуры, сканера или любого другого источника ввода.
Шаг 4. Обработка данных
На этом этапе необработанные данные подвергаются различным методам обработки с использованием алгоритмов машинного обучения и искусственного интеллекта для получения желаемого результата. Этот шаг может немного отличаться от процесса к процессу в зависимости от источника обрабатываемых данных (озера данных, онлайн-базы данных, подключенные устройства и т. д.) и предполагаемого использования выходных данных.
Шаг 5. Вывод
Данные, наконец, передаются и отображаются пользователю в удобочитаемой форме, такой как графики, таблицы, векторные файлы, аудио, видео, документы и т. д. Эти выходные данные могут быть сохранены и обработаны в следующем цикле обработки данных. р>
Шаг 6. Хранение
Последним этапом цикла обработки данных является хранение, где данные и метаданные сохраняются для дальнейшего использования. Это обеспечивает быстрый доступ и извлечение информации, когда это необходимо, а также позволяет напрямую использовать ее в качестве входных данных в следующем цикле обработки данных.
Бесплатный курс: Разработчик больших данных Hadoop и Spark
Теперь, когда мы узнали, что такое обработка данных и ее цикл, теперь мы можем рассмотреть типы.
Типы обработки данных
Существуют различные типы обработки данных в зависимости от источника данных и шагов, предпринимаемых блоком обработки для создания выходных данных.Не существует универсального метода обработки необработанных данных.
Данные собираются и обрабатываются пакетами. Используется для больших объемов данных.
Например: система начисления заработной платы
Данные обрабатываются в течение нескольких секунд после ввода. Используется для небольших объемов данных.
Например: снятие денег в банкомате
Данные автоматически загружаются в ЦП, как только они становятся доступными. Используется для непрерывной обработки данных.
Например: сканирование штрих-кода
Данные разбиваются на кадры и обрабатываются с использованием двух или более ЦП в рамках одной компьютерной системы. Также называется параллельной обработкой.
Например: прогноз погоды
Выделяет компьютерные ресурсы и данные во временных интервалах нескольким пользователям одновременно.
Методы обработки данных
Существует три основных метода обработки данных: ручной, механический и электронный.
Ручная обработка данных
В этом методе обработки данные обрабатываются вручную. Весь процесс сбора данных, фильтрации, сортировки, расчета и других логических операций выполняется с участием человека без использования какого-либо другого электронного устройства или программного обеспечения для автоматизации. Это недорогой метод, практически не требующий инструментов, но приводящий к большому количеству ошибок, высоким трудозатратам и большим затратам времени.
Механическая обработка данных
Данные обрабатываются механически с помощью устройств и машин. Это могут быть простые устройства, такие как калькуляторы, пишущие машинки, печатный станок и т. д. С помощью этого метода можно выполнять простые операции обработки данных. Он дает гораздо меньше ошибок, чем ручная обработка данных, но увеличение объема данных сделало этот метод более сложным и трудным.
Изучайте науку о данных с помощью R БЕСПЛАТНО
Электронная обработка данных
Данные обрабатываются современными технологиями с использованием программного обеспечения и программ для обработки данных. Программному обеспечению дается набор инструкций для обработки данных и получения вывода. Этот метод является самым дорогим, но обеспечивает самые высокие скорости обработки с высочайшей надежностью и точностью вывода.
Примеры обработки данных
Обработка данных происходит в нашей повседневной жизни независимо от того, знаем мы об этом или нет. Вот несколько реальных примеров обработки данных:
- Программное обеспечение для торговли акциями, которое преобразует миллионы данных об акциях в простой график.
- Компания, занимающаяся электронной торговлей, использует историю поиска клиентов, чтобы рекомендовать похожие товары.
- Компания, занимающаяся цифровым маркетингом, использует демографические данные людей для разработки стратегии кампаний с учетом местоположения.
- Автономный автомобиль использует данные датчиков в режиме реального времени, чтобы определять, есть ли на дороге пешеходы и другие автомобили.
Это все, что касается статьи о том, что такое обработка данных.
Хотите начать карьеру инженера по работе с большими данными? Посетите учебный курс для инженеров по работе с большими данными и получите сертификат.
Что вы можете сделать дальше
Данные содержат много полезной информации для организаций, исследователей, учреждений и отдельных пользователей. С увеличением объема данных, генерируемых каждый день, возникает потребность в большем количестве ученых и инженеров данных, которые помогут понять эти данные. Сертификационный курс Simplilearn Data Engineering Certification Course в сотрудничестве с IBM и Университетом Purdue предлагает высочайший уровень обучения, который поможет вам овладеть важнейшими навыками обработки данных. Эта программа, основанная на академическом превосходстве Университета Пердью в области инженерии данных и практическом опыте обучения IBM, поможет ускорить вашу карьеру в качестве специалиста по обработке данных.
Надеюсь, вам понравилась статья «что такое обработка данных». В случае сомнений задавайте свои вопросы в разделе комментариев.
Найдите наш онлайн-учебный курс для аспирантов по инженерии данных в лучших городах:
Имя | Дата | Место | |
---|---|---|---|
Программа последипломного образования в Data Engineering | Когорта начинается 5 апреля 2022 г., Группа выходного дня | Ваш город | Подробнее | Программа последипломного образования в области инженерии данных | Когорта начинается 19 апреля 2022 г., группа выходного дня | Ваш город | Просмотреть подробности< /td> |
Программа последипломного образования в области инженерии данных | Когорта начинается 6 мая 2022 г., Группа выходного дня | Ваш город td> | Подробнее |
Об авторе
Никита Дуггал
Никита Дуггал — увлеченный цифровой кочевник, специализирующийся на английском языке и литературе, знаток слов, который любит писать о бушующих технологиях, цифровом маркетинге и карьерных загадках.
Читайте также: