В чем главный недостаток плоских файлов

Обновлено: 29.06.2024

Размещение данных в базе данных с плоскими файлами имеет следующие преимущества

  • Все записи хранятся в одном месте
  • Простота настройки с помощью ряда стандартных офисных приложений.
  • Легко понять
  • Возможна простая сортировка записей
  • Запись можно просмотреть или извлечь на основе простых критериев.

Повседневные данные, такие как деловые контакты, списки клиентов и т. д., можно хранить и использовать в базе данных в виде неструктурированного файла.

Но у них есть серьезные недостатки, когда речь идет о более чем нескольких тысячах записей. Рассмотрим плоскую таблицу файлов, которую вы видели ранее

<р>1. Возможное дублирование. По мере того, как в базу данных добавляется все больше и больше записей, становится все труднее избегать дублирования записей. Это связано с тем, что в систему не встроен механизм предотвращения дублирования. Позже вы увидите, как для предотвращения этого используются «первичные ключи».

<р>2. Неуникальные записи. Обратите внимание, что у мистера и миссис Джонс одинаковые идентификаторы. Это связано с тем, что человек, создающий эту базу данных, решил, что может захотеть отсортировать одинаковые телефонные номера, и поэтому применил одинаковый идентификатор к двум записям. Это нормально для этой цели, но предположим, что вы хотите извлечь только запись миссис Джонс. Теперь это намного сложнее.

<р>3. Сложнее обновить. Предположим, что эта база данных с плоскими файлами также хранит информацию об их рабочих местах — это приведет к множеству записей для каждого человека. Опять же, это нормально, но предположим, что Сандра Джонс после повторного замужества захотела бы называться «Сандра Томпсон»? Это должно быть сделано для потенциально большого количества записей, поэтому обновления неструктурированных файлов более подвержены ошибкам, чем другие методы

<р>4. По своей сути неэффективен. Рассмотрим ситуацию, когда база данных теперь должна содержать дополнительное поле для хранения их адреса электронной почты. Если есть десятки тысяч записей, у многих людей может не быть адресов электронной почты, но каждая запись в базе данных с плоским файлом должна иметь одни и те же поля, независимо от того, используются они или нет. Другие методы позволяют избежать ненужной траты памяти.

<р>5. Сложнее изменить формат данных. Предположим, что телефонные номера теперь должны иметь тире между кодом города и остальной частью номера, например, 0223-44033. Добавление этого дополнительного тире к десяткам тысяч записей было бы серьезной задачей в базе данных с плоскими файлами.

<р>6. Плохо справляется со сложными запросами. Если бы мы хотели найти все записи с определенным номером телефона, это был бы простой критерий с одним полем, с которым легко справился бы плоский файл. Но теперь предположим, что нам нужны все люди, живущие в Халле, с одинаковыми фамилиями и одинаковыми почтовыми индексами? - критерии могут быстро стать слишком сложными для управления простым файлом.

<р>7. Плохо ограничивает доступ. Предположим, что эта база данных с плоскими файлами содержит конфиденциальное поле в каждой записи, которое разрешено видеть только определенным сотрудникам — например, зарплаты. Этого трудно добиться в базе данных с плоскими файлами — как только человек ввел действительный пароль для получения доступа, он может видеть все.

Из-за этих ограничений были разработаны другие типы баз данных. На следующих нескольких страницах они будут описаны и их функции.

Проверьте, сможете ли вы узнать еще один факт по этой теме, о котором мы вам еще не рассказали

Базы данных с плоскими файлами


Данные, хранящиеся в системе ИКТ, хранятся и организуются в файлах. Когда данные организованы в строки и столбцы с повторяющимися значениями данных, такой файл называется одноуровневым.

Плоский файл выглядит как электронная таблица; он двумерный и не имеет связанных файлов (или таблиц). Плоские файлы легко создавать и использовать (для небольших объемов данных). Данные часто повторяются в плоском файле, поэтому они могут быть довольно большими по размеру.

flat-file1

В приведенном выше примере каждый предмет, который изучает ученик, должен быть введен как отдельная запись.

Избыточность
Этот файл имеет очень простую структуру строк и столбцов. Между данными нет связи. Основная слабость этого типа файлов заключается в том, что данные должны повторяться. Посмотрите на запись «Амина Ахмед». Ее имя записано дважды, потому что она изучает и английский язык, и математику.
В системе реляционной базы данных этого бы не произошло. Фамилия и имя каждого человека будут сохранены только один раз, а для хранения остальных данных будет создана связанная таблица. После этого две таблицы будут связаны. Когда данные повторяются без необходимости, говорят, что они избыточны.

flat-file2

Если сделать еще одну запись для Амины Ахмед, файл теперь будет выглядеть так:

Новая запись содержит неверные данные. Имя Амины Ахмед записано как «Эми».


Целостность данных
Чем чаще данные записываются, тем выше вероятность того, что данные содержат ошибки или несоответствия. Пользователь данных должен иметь возможность полагаться на правильность и точность данных. Правильность, надежность и точность данных называется целостностью данных.

"У вас есть некоторые опасения по поводу переноса всех операций вашей авиакомпании с SQL на этот формат плоского файла. Напишите своему начальнику служебную записку, в которой изложите любые опасения или сомнения, которые у вас есть по поводу перехода на этот формат для управления ваши данные. Включите плюсы и минусы формата реляционной базы данных и формата плоского файла. Обязательно подумайте критически и включите любые проблемные сценарии использования."

Из последних нескольких совещаний сотрудников я знаю, что мы собираемся изменить конфигурацию нашей базы данных с традиционной системы управления реляционными базами данных (RDBMS) на систему, основанную на хранении неструктурированных файлов.

Преимущества плоской файловой системы

Двумя основными преимуществами плоской файловой системы являются простота хранения записей и простота использования данных.

Хранилище записей

Одним из основных преимуществ системы на основе неструктурированных файлов является хранение всех доступных данных в одном месте. Это означает, что все доступные данные находятся в любой заданной записи. В случае с нашими данными плоская файловая система будет выглядеть так.

Flight_ID Airport_Code_Origin Airport_Code_DateTime Departure_DateTime Airport_Code Airport_Location Year_Opened Num_of_Terminals Manufacturer Model_Num Original_Purchase_Date Last_Service Number_of_Seats Carrier_Name 1 MIA JFK 20.02.16 23:26 21.02.16 4:04 JFK Нью-Йорк, Нью-Йорк 19 /2/09 26.01.16 500 Virgin Atlantic
2 MIA SFO 21.02.16 8:55 21.02.16 9:11 SFO Сан-Франциско, Калифорния 1927 8 Boeing 737-900 2/12/ 09 26.01.16 500 Southwest Airlines
3 LAS PHL 21.02.16 12:51 21.02.16 15:18 PHL Филадельфия, Пенсильвания 1927 6 Embraer RJ-45 25.11.08 27.01 /16 550 Delta
4 SFO PIT 21.02.16 21:45 21.02.16 23:18 PIT Питтсбург, Пенсильвания 1946 4 Boeing 747-400 25.10.01 3.01.16 250 Southwest Airlines
5 IAH PIT 22.02.16 19:34 22.02.16 22:27 PIT Питсбург, Пенсильвания, 1946 4 Airbus A330 02.12.01 16.12.15 400 Virgin Atlantic

Каждая запись полета будет включать все необходимые поля для описания полета. Такая настройка делает данные легко читаемыми и понятными для всех, у кого есть доступ к файлу.

Простота использования

Второе преимущество, которое мы рассмотрим, — это простота использования базы данных. Плоскую файловую систему можно просматривать из любого количества приложений, что делает ее очень доступной. У пользователей также будет очень мало проблем с пониманием данных, потому что каждая запись содержит всю доступную информацию о данном полете. Простые запросы и сортировка не должны быть проблемой для большинства систем на основе плоских файлов.

Недостатки плоских файловых систем

Хотя система на основе плоских файлов может работать с некоторыми наборами данных, я не думаю, что она подходит для нас. Есть несколько недостатков использования плоской файловой системы для наших данных. К ним относятся дублирование данных, сложность обновления и безопасность данных.

Дублирование данных

В примере извлечения данных, показанном выше, записи 1 и 2 относятся к рейсам, вылетающим из аэропорта МВД. Каждая запись включает данные об этом аэропорту. Это дублирование данных приводит к увеличению размера плоской файловой системы за счет ненужных данных. Дублируются не только данные исходящих аэропортов, но и данные о самолетах для каждого рейса по маршруту этого дня. В нашей СУБД такого дублирования нет, потому что данные об аэропорте сохраняются только один раз. То же самое относится и к данным о самолетах и ​​авиаперевозчиках. Это приводит нас к следующему недостатку — сложности с обновлением записей.

Обновить сложность

Как упоминалось в предыдущем разделе, в плоском файле много повторяющихся данных. Представьте, когда необходимо обновить часть данных. В случае самолета мы отслеживаем дату последнего обслуживания. Когда самолет обслуживается, нам нужно будет обновить каждый экземпляр этого самолета в плоском файле. Это позволило бы мне просмотреть весь файл данных и обновить дату последнего обслуживания. Даже с автоматическим сценарием обновления это займет много времени и чревато ошибками. Это всего лишь один случай использования, когда обновления могут быть затруднены. Тот же процесс необходимо будет применить к данным об аэропортах и ​​перевозчиках. Потребовалось бы, чтобы несколько пользователей обращались к данным, чтобы обработать количество обновлений, которые мы сгенерируем. Кто будет иметь доступ и как мы будем его контролировать — это последний недостаток, о котором я хотел бы рассказать подробнее.

Безопасность данных

Данные, хранящиеся в неструктурированных файловых системах, трудно ограничить. В этом типе конфигурации могут применяться только ограничения на уровне файлов. Отдельные записи не могут быть защищены. Пользователь, имеющий доступ к файлу, имеет доступ ко всем записям. В нашей системе нам необходимо ограничить уровень доступа для каждого рейса.Это было бы невозможно в плоской файловой системе.

Рекомендация

Я рекомендую оставить нашу систему в том состоянии, в котором она сейчас настроена. Поскольку мы используем СУБД, к нашим данным можно получить доступ различными способами. От экранов в терминалах аэропорта, показывающих списки рейсов только для чтения, до агентов на посадке, обновляющих записи о рейсах, наши данные гораздо лучше настраиваются в соответствии с нашими потребностями в РСУБД.

Карлтон Мэтьюз

Муж | Отец | Подкастер | Технолог Один парень наслаждается жизнью, которую ему подарили

Перенесите свой SQL-сервер на облачный citrix vdi от Apps4Rent по невероятной цене citrix xendesktop и получите удобный удаленный доступ к нему из любого места на любом устройстве (ПК/Mac/Linux/android/iOS) на базе одного из ведущих поставщики Office 365 — O365CloudExperts.

Недостаток файловой системы:

1. Избыточность данных:

  • Возможно, что одна и та же информация может дублироваться в разных файлах. Это приводит к избыточности данных, что приводит к нерациональному использованию памяти.

2. Несоответствие данных:

  • Из-за избыточности данных данные могут находиться в несогласованном состоянии.

3. Трудности с доступом к данным:

  • Доступ к данным неудобен и неэффективен в системе обработки файлов.

4. Ограниченный обмен данными:

  • Данные разбросаны по разным файлам. Также разные файлы могут иметь разный формат и эти файлы могут храниться в разных папках, могут быть разных отделов.
  • Таким образом, из-за такой изоляции данных трудно обмениваться данными между различными приложениями.

5. Проблемы целостности:

  • Целостность данных означает, что данные, содержащиеся в базе данных, являются правильными и непротиворечивыми. Для этой цели данные, хранящиеся в базе данных, должны удовлетворять правильности и ограничениям.

6. Проблемы атомарности:

  • Любая операция с базой данных должна быть атомарной.
  • это означает, что это должно произойти полностью или не произойти вообще.

7. Аномалии одновременного доступа:

  • Несколько пользователей могут одновременно получать доступ к данным. Это делается для повышения производительности и более быстрого отклика.

8. Проблемы безопасности:

  • База данных должна быть доступна для пользователей в ограниченном режиме.
  • Каждому пользователю должен быть разрешен доступ к данным, касающимся только его потребностей.

Подпишитесь на нас на Youtube

Поделиться этой страницей

Вопросы


Как я могу узнать базу данных и мой sql


Пожалуйста, предоставьте нам полную информацию о преимуществах и недостатках на простом примере


Дикшита | 07 февраля 2018 г., 18:27:26

Что такое интеллектуальный анализ данных в СУБД


Данные Сбор необработанных фактов (мы легко понимаем, но компьютер не понимает) и цифр называется данными. Данные могут необработанные формы необработанных фактов. Данные, используемые в качестве входных данных в компьютере. Это не имеет смысла. Данные огромны по объему. 2 +3 =5 Приведенные выше примеры 2 и 3 в необработанном виде необработанных фактов, но 5 представляет собой информацию на экране компьютера процессором.


< /p>

Плоская файловая база данных является эффективным методом хранения ограниченного количества записей. Электронная таблица Excel, в которой каждая строка является записью, а каждый столбец — полем, может считаться плоским файлом. У таких способов хранения данных есть определенные преимущества. Во-первых, все записи могут храниться в одном месте. Их также легко настроить, не требуется специальных знаний, и их легко понять. Поскольку они являются независимыми, самодостаточными файлами, они не требуют конфигурации внешнего хранилища и могут быть легко отредактированы и доступны. Плоские файлы часто используются для отслеживания повседневных дел компании, таких как деловые контакты и списки клиентов.

Однако базы данных с плоскими файлами имеют ряд существенных недостатков и, как правило, неэффективны для крупномасштабного ведения записей. Некоторые проблемы, которые могут возникнуть при их использовании, включают возможность дублирования и сложность сохранения уникальности записей. Это может привести к нерациональному хранению и уровням неэффективности. Кроме того, могут возникнуть трудности с внесением изменений в формат вводимых данных и получением любых данных, требующих множественных запросов.

Реляционные базы данных: плюсы и минусы

Реляционные базы данных были разработаны, чтобы обойти ограничения, присущие простому плоскому файлу.В то время как плоский файл содержит только одну таблицу, реляционная база данных хранит данные в нескольких таблицах, состоящих из столбцов ключевых значений и сохраненных значений, что позволяет связать одну таблицу с другой. Реляционным базам данных требуется структура для их хранения, называемая сервером, для хранения и интерпретации данных. Они также зависят от конкретных инструментов для просмотра и интерпретации содержащейся в них информации. В реляционных базах данных информация хранится рандомизированным образом только для организации при извлечении. В отличие от простых файлов, реляционные базы данных могут обрабатывать более динамичные запросы.

Читайте также: