Информационная модель, имеющая табличную структуру, представляет собой файловую систему компьютера

Обновлено: 21.11.2024

Раньше данные сохранялись вручную с помощью ручки и бумаги, но после того, как был обнаружен компьютер, ту же задачу можно было выполнять с помощью файлов. Компьютерный файл — это ресурс, который уникальным образом записывает данные на запоминающее устройство компьютера. Существуют различные форматы, в которых могут храниться данные. например Текстовые файлы можно хранить в формате .txt, а изображения — в формате .jpg и т. д.

В случае компьютерных файлов данные о данных (метаданные) могут храниться в разных строках, разделенных пробелами, запятыми или табуляцией, чтобы они напоминали таблицы. Каждый файл помещен в соответствующие папки для удобства доступа. Это можно понять из скриншота Блокнота ниже. Для школы GeeksforGeeks, имеющей классы с 1 по 5, данные могут храниться в файловой системе следующим образом.

Примечание –
Здесь в школе GeeksforGeeks есть несколько классов, изображенных через папки (Geeks of 1 class, Geeks of 2 class и т.д.). В папках есть файлы с информацией о студентах (All Geeks.txt). Детали хранятся в табличном виде с использованием пробелов.

Система обработки файлов:
В компьютерных науках система обработки файлов (FPS) — это способ хранения, извлечения и обработки данных, которые присутствуют в различных файлах.

Файлы используются для хранения различных документов. Все файлы сгруппированы по категориям. Имена файлов очень связаны друг с другом и организованы правильно, чтобы легко получить доступ к файлам. В системе обработки файлов, если нужно вставить, удалить, изменить, сохранить или обновить данные, нужно знать всю иерархию файлов.

  • Экономичность.
    Плата за установку и использование системы обработки файлов очень минимальна или вообще отсутствует. (В большинстве случаев бесплатные инструменты встроены в компьютеры.)
  • Простота в использовании.
    Файловые системы требуют базового изучения и понимания, поэтому ими легко пользоваться.
  • Высокая масштабируемость.
    Можно очень легко переключаться с файлов меньшего размера на файлы большего размера в соответствии со своими потребностями.
  • Медленное время доступа.
    Прямой доступ к файлам очень сложен, и нужно знать всю иерархию папок, чтобы добраться до определенного файла. Это требует много времени.
  • Наличие избыточных данных.
    Одни и те же данные могут присутствовать в двух или более файлах, что занимает больше места на диске.
  • Несогласованные данные.
    Из-за избыточности данных одни и те же данные, хранящиеся в разных местах, могут не совпадать друг с другом.
  • Проблемы с целостностью данных.
    Данные в базе данных должны быть согласованными и правильными. Для этого данные должны удовлетворять определенным ограничениям.
  • Сложность восстановления поврежденных данных.
    Восстановление или резервное копирование потерянных и поврежденных данных практически невозможно в случае системы обработки файлов.
  • Отсутствие атомарности.
    Операции, выполняемые в базе данных, должны быть атомарными, т. е. либо операция выполняется целиком, либо не выполняется вообще.
  • Проблема с одновременным доступом.
    Когда несколько пользователей работают с общими данными в базе данных одновременно, возникают аномалии из-за отсутствия контроля параллелизма.
  • Неавторизованный доступ —

Любой, у кого есть доступ к файлу, может прочитать или изменить данные.

Примечание.
Система управления базами данных (СУБД) используется для устранения недостатков FPS.

Модель базы данных показывает логическую структуру базы данных, включая отношения и ограничения, которые определяют, как данные могут храниться и получать к ним доступ. Отдельные модели баз данных разрабатываются на основе правил и концепций той более широкой модели данных, которую принимают разработчики. Большинство моделей данных можно представить с помощью прилагаемой схемы базы данных.

Хотите создать собственную схему базы данных? Попробуйте Люсидчарт. Это быстро, просто и совершенно бесплатно.

Типы моделей баз данных

Существует множество моделей данных. Вот некоторые из наиболее распространенных:

  • Иерархическая модель базы данных
  • Реляционная модель
  • Сетевая модель
  • Объектно-ориентированная модель базы данных
  • Модель "сущность-связь"
  • Модель документа
  • Модель "сущность-атрибут-значение"
  • Схема со звездочкой
  • Объектно-реляционная модель, объединяющая две составляющие ее названия.

Вы можете описать базу данных с помощью любого из них в зависимости от нескольких факторов. Важнейшим фактором является то, поддерживает ли используемая вами система управления базами данных конкретную модель. Большинство систем управления базами данных создаются с учетом определенной модели данных и требуют от пользователей принятия этой модели, хотя некоторые из них поддерживают несколько моделей.

Кроме того, разные модели применяются к разным этапам процесса проектирования базы данных.Концептуальные модели данных высокого уровня лучше всего подходят для отображения взаимосвязей между данными так, как люди воспринимают эти данные. С другой стороны, логические модели на основе записей более точно отражают способы хранения данных на сервере.

Выбор модели данных также заключается в согласовании ваших приоритетов для базы данных с сильными сторонами конкретной модели, будь то скорость, снижение затрат, удобство использования или что-то еще.

Давайте подробнее рассмотрим некоторые из наиболее распространенных моделей баз данных.

Реляционная модель

Самая распространенная реляционная модель сортирует данные в таблицы, также известные как отношения, каждая из которых состоит из столбцов и строк. В каждом столбце указан атрибут объекта, о котором идет речь, например, цена, почтовый индекс или дата рождения. Вместе атрибуты в отношении называются доменом. Конкретный атрибут или комбинация атрибутов выбирается в качестве первичного ключа, на который можно ссылаться в других таблицах, когда он называется внешним ключом.

Каждая строка, также называемая кортежем, содержит данные о конкретном экземпляре рассматриваемого объекта, например о конкретном сотруднике.

Модель также учитывает типы отношений между этими таблицами, включая отношения "один к одному", "один ко многим" и "многие ко многим". Вот пример:

В базе данных таблицы можно нормализовать или привести в соответствие с правилами нормализации, которые делают базу данных гибкой, адаптируемой и масштабируемой. При нормализации каждый фрагмент данных является атомарным или разбитым на мельчайшие полезные фрагменты.

Реляционные базы данных обычно пишутся на языке структурированных запросов (SQL). Модель была представлена ​​Э. Ф. Коддом в 1970 году.

Иерархическая модель

Иерархическая модель упорядочивает данные в виде древовидной структуры, в которой каждая запись имеет одного родителя или корень. Записи братьев и сестер сортируются в определенном порядке. Этот порядок используется как физический порядок хранения базы данных. Эта модель хороша для описания многих отношений в реальном мире.

Эта модель в основном использовалась в системах управления информацией IBM в 60-х и 70-х годах, но сегодня они редко встречаются из-за определенной операционной неэффективности.

Сетевая модель

Сетевая модель основывается на иерархической модели, допуская отношения "многие ко многим" между связанными записями, что подразумевает несколько родительских записей. На основе математической теории множеств модель строится с наборами связанных записей. Каждый набор состоит из одной записи о владельце или родительской записи и одной или нескольких записей-членов или дочерних записей. Запись может быть элементом или дочерним элементом в нескольких наборах, что позволяет этой модели передавать сложные отношения.

Он был наиболее популярен в 70-х годах после того, как был официально определен Конференцией по языкам систем данных (CODASYL).

Объектно-ориентированная модель базы данных

В этой модели база данных определяется как набор объектов или программных элементов многократного использования со связанными функциями и методами. Существует несколько видов объектно-ориентированных баз данных:

Мультимедийная база данных включает мультимедийные файлы, например изображения, которые нельзя хранить в реляционной базе данных.

Гипертекстовая база данных позволяет любому объекту связываться с любым другим объектом. Это полезно для организации большого количества разрозненных данных, но не идеально для числового анализа.

Объектно-ориентированная модель базы данных — это наиболее известная постреляционная модель базы данных, поскольку она включает в себя таблицы, но не ограничивается ими. Такие модели также называются гибридными моделями баз данных.

С Lucidchart можно быстро и легко строить диаграммы. Начните бесплатную пробную версию сегодня, чтобы начать творить и сотрудничать.

Объектно-реляционная модель

Эта гибридная модель базы данных сочетает в себе простоту реляционной модели с некоторыми расширенными функциями объектно-ориентированной модели базы данных. По сути, это позволяет дизайнерам включать объекты в привычную структуру таблицы.

Языки и интерфейсы вызовов включают SQL3, языки поставщиков, ODBC, JDBC и проприетарные интерфейсы вызовов, являющиеся расширениями языков и интерфейсов, используемых реляционной моделью.

Модель "сущность-связь"

Эта модель отражает отношения между реальными объектами так же, как и сетевая модель, но она не так напрямую связана с физической структурой базы данных. Вместо этого он часто используется для концептуального проектирования базы данных.

Здесь люди, места и вещи, о которых хранятся точки данных, называются объектами, каждый из которых имеет определенные атрибуты, которые вместе составляют их домен. Количество элементов или отношения между объектами также сопоставляются.

Распространенной формой ER-диаграммы является схема "звезда", в которой центральная таблица фактов соединяется с многомерными таблицами.

Другие модели баз данных

Сегодня используется или используется множество других моделей баз данных.

Перевернутая файловая модель

База данных, созданная с инвертированной файловой структурой, предназначена для облегчения быстрого полнотекстового поиска. В этой модели содержимое данных индексируется как последовательность ключей в таблице поиска со значениями, указывающими на расположение связанных файлов. Эта структура может обеспечить почти мгновенную отчетность, например, по большим данным и аналитике.

Эта модель используется системой управления базами данных ADABAS компании Software AG с 1970 года и поддерживается по сей день.

Плоская модель

Плоская модель – это самая ранняя и простейшая модель данных. Он просто перечисляет все данные в одной таблице, состоящей из столбцов и строк. Чтобы получить доступ к данным или манипулировать ими, компьютер должен прочитать весь плоский файл в память, что делает эту модель неэффективной для всех наборов данных, кроме самых маленьких.

Многомерная модель

Это вариант реляционной модели, предназначенный для улучшения аналитической обработки. Хотя реляционная модель оптимизирована для онлайн-обработки транзакций (OLTP), эта модель предназначена для интерактивной аналитической обработки (OLAP).

Каждая ячейка многомерной базы данных содержит данные об измерениях, отслеживаемых базой данных. Визуально это похоже на набор кубов, а не на двумерные таблицы.

Полуструктурированная модель

В этой модели структурные данные, обычно содержащиеся в схеме базы данных, встроены в сами данные. Здесь различие между данными и схемой в лучшем случае расплывчато. Эта модель полезна для описания систем, таких как определенные веб-источники данных, которые мы рассматриваем как базы данных, но не можем ограничивать их схемой. Это также полезно для описания взаимодействия между базами данных, которые не придерживаются одной и той же схемы.

Контекстная модель

При необходимости эта модель может включать элементы из других моделей баз данных. Он объединяет элементы объектно-ориентированных, полуструктурированных и сетевых моделей.

Ассоциативная модель

Эта модель разделяет все точки данных в зависимости от того, описывают ли они объект или связь. В этой модели сущность — это все, что существует независимо, тогда как ассоциация — это то, что существует только по отношению к чему-то другому.

Ассоциативная модель структурирует данные в два набора:

  • Набор элементов, каждый из которых имеет уникальный идентификатор, имя и тип.
  • Набор ссылок, каждая из которых имеет уникальный идентификатор и уникальные идентификаторы источника, глагола и цели. Сохраненный факт связан с источником, и каждый из трех идентификаторов может относиться либо к ссылке, либо к элементу.

Другие, менее распространенные модели баз данных включают:

  • Семантическая модель, включающая информацию о том, как хранимые данные соотносятся с реальным миром.
  • База данных XML, которая позволяет задавать данные и даже сохранять их в формате XML.
  • Именованный график
  • Тройной магазин

Модели баз данных NoSQL

Помимо модели объектной базы данных, в отличие от реляционной модели, появились другие модели, отличные от SQL:

Модель графовой базы данных, которая даже более гибкая, чем сетевая модель, позволяет любому узлу соединяться с любым другим.

Многозначная модель, отличающаяся от реляционной модели тем, что атрибуты могут содержать список данных, а не одну точку данных.

Модель документа, предназначенная для хранения и управления документами или частично структурированными данными, а не атомарными данными.

Базы данных в Интернете

Большинство веб-сайтов используют какую-либо базу данных для организации и представления данных пользователям. Всякий раз, когда кто-либо использует функции поиска на этих сайтах, его условия поиска преобразуются в запросы для обработки сервером базы данных. Обычно ПО промежуточного слоя соединяет веб-сервер с базой данных.

Широкое присутствие баз данных позволяет использовать их практически в любой сфере, от покупок в Интернете до микротаргетинга на сегмент избирателей в рамках политической кампании. В различных отраслях промышленности, от воздушного транспорта до автомобилестроения, разработаны собственные стандарты проектирования баз данных.

Полезные ресурсы

Когда вы будете готовы приступить к моделированию своей базы данных, попробуйте Lucidchart. Это идеальный инструмент для быстрого и простого создания эскизов систем баз данных. Вы даже можете импортировать и экспортировать из SQL. Начните бесплатную пробную версию сегодня!

Хотите создать собственную схему базы данных? Попробуйте Люсидчарт. Это быстро, просто и совершенно бесплатно.

В этой статье объясняются различия между таблицей размещения файлов (FAT), высокопроизводительной файловой системой (HPFS) и файловой системой NT (NTFS) в Windows NT, а также их преимущества и недостатки.

Применимо к: Windows 10 — все выпуски, Windows Server 2012 R2
Исходный номер базы знаний: 100108

HPFS поддерживается только в Windows NT версий 3.1, 3.5 и 3.51. Windows NT 4.0 не поддерживает и не может получить доступ к разделам HPFS.Кроме того, поддержка файловой системы FAT32 стала доступна в Windows 98/Windows 95 OSR2 и Windows 2000.

Обзор FAT

FAT — самая простая из файловых систем, поддерживаемых Windows NT. Файловая система FAT характеризуется таблицей размещения файлов (FAT), которая на самом деле является таблицей, находящейся в самом «верху» тома. Для защиты тома хранятся две копии FAT на случай повреждения одной из них. Кроме того, таблицы FAT и корневой каталог должны храниться в фиксированном месте, чтобы загрузочные файлы системы могли быть правильно расположены.

Диск, отформатированный с помощью FAT, размещается в кластерах, размер которых определяется размером тома. При создании файла в каталоге создается запись и устанавливается первый номер кластера, содержащего данные. Эта запись в таблице FAT либо указывает, что это последний кластер файла, либо указывает на следующий кластер.

Обновление таблицы FAT очень важно и требует много времени. Если таблица FAT регулярно не обновляется, это может привести к потере данных. Это отнимает много времени, поскольку головки чтения диска должны перемещаться на нулевую логическую дорожку диска каждый раз при обновлении таблицы FAT.

Структура каталогов FAT не организована, и файлы размещаются в первом открытом месте на диске. Кроме того, FAT поддерживает только атрибуты файлов только для чтения, скрытые, системные и архивные.

Соглашение об именах FAT

FAT использует традиционное соглашение об именах файлов 8.3, и все имена файлов должны создаваться с использованием набора символов ASCII. Имя файла или каталога может содержать до восьми символов, затем разделитель точки (.) и расширение до трех символов. Имя должно начинаться с буквы или цифры и может содержать любые символы, кроме следующих:

При использовании любого из этих символов могут возникнуть непредвиденные результаты. Имя не может содержать пробелов.

Следующие имена зарезервированы:

CON, AUX, COM1, COM2, COM3, COM4, ​​LPT1, LPT2, LPT3, PRN, NUL

Все символы будут преобразованы в верхний регистр.

Преимущества FAT

Невозможно выполнить восстановление в Windows NT ни в одной из поддерживаемых файловых систем. Утилиты восстановления пытаются получить прямой доступ к оборудованию, что невозможно сделать в Windows NT. Однако, если файл находился в разделе FAT и система перезагружается в MS-DOS, файл можно восстановить. Файловая система FAT лучше всего подходит для дисков и/или разделов размером менее 200 МБ, потому что FAT начинается с очень небольших накладных расходов. Для дальнейшего обсуждения преимуществ FAT см. следующее:

Windows NT Server "Концепции и руководство по планированию", глава 5, раздел "Выбор файловой системы"

Комплект ресурсов Windows NT Workstation 4.0, глава 18, "Выбор файловой системы"

Комплект ресурсов Windows NT Server 4.0 "Руководство по ресурсам", глава 3, раздел "Какую файловую систему использовать на каких томах"

Недостатки FAT

При использовании дисков или разделов размером более 200 МБ желательно не использовать файловую систему FAT. Это связано с тем, что по мере увеличения размера тома производительность с FAT быстро снижается. Невозможно установить разрешения для файлов, которые являются разделами FAT.

Размер разделов FAT ограничен 4 гигабайтами (ГБ) в Windows NT и 2 ГБ в MS-DOS.

Для дальнейшего обсуждения других недостатков FAT см. следующее:

Windows NT Server "Концепции и руководство по планированию", глава 5, раздел "Выбор файловой системы"

Комплект ресурсов Windows NT Workstation 4.0, глава 18, "Выбор файловой системы"

Комплект ресурсов Microsoft Windows NT Server 4.0 "Руководство по ресурсам", глава 3, раздел "Какую файловую систему использовать на каких томах"

Обзор HPFS

Файловая система HPFS была впервые представлена ​​в OS/2 1.2, чтобы обеспечить более широкий доступ к большим жестким дискам, которые тогда появлялись на рынке. Кроме того, для новой файловой системы было необходимо расширить систему именования, организацию и безопасность для растущих потребностей рынка сетевых серверов. HPFS поддерживает организацию каталогов FAT, но добавляет автоматическую сортировку каталога на основе имен файлов. Имена файлов расширены до 254 двухбайтовых символов. HPFS также позволяет составлять файл из «данных» и специальных атрибутов, чтобы обеспечить повышенную гибкость с точки зрения поддержки других соглашений об именах и безопасности. Кроме того, единица распределения изменена с кластеров на физические секторы (512 байт), что сокращает потери дискового пространства.

В HPFS записи каталога содержат больше информации, чем в FAT. Помимо файла атрибутов, он включает информацию о дате и времени модификации, создания и доступа. Вместо того, чтобы указывать на первый кластер файла, записи каталога в HPFS указывают на FNODE.FNODE может содержать данные файла или указатели, которые могут указывать на данные файла или на другие структуры, которые в конечном итоге будут указывать на данные файла.

HPFS пытается разместить как можно больше файлов в смежных секторах. Это сделано для увеличения скорости при последовательной обработке файла.

Кроме того, HPFS включает несколько уникальных специальных объектов данных:

Суперблок

Суперблок расположен в логическом секторе 16 и содержит указатель на FNODE корневого каталога. Одна из самых больших опасностей использования HPFS заключается в том, что если суперблок потерян или поврежден из-за плохого сектора, то же самое произойдет и с содержимым раздела, даже если остальная часть диска в порядке. Восстановить данные на диске можно было бы, скопировав все на другой диск с исправным сектором 16 и перестроив суперблок. Однако это очень сложная задача.

Запасной блок

Запасной блок расположен в логическом секторе 17 и содержит таблицу «горячих исправлений» и блок запасного каталога. В HPFS при обнаружении поврежденного сектора запись «горячих исправлений» используется для логического указания на существующий исправный сектор вместо поврежденного сектора. Этот метод обработки ошибок записи называется оперативным исправлением.

Оперативное исправление – это метод, при котором в случае возникновения ошибки из-за поврежденного сектора файловая система перемещает информацию в другой сектор и помечает исходный сектор как неисправный. Все это делается прозрачно для любых приложений, выполняющих дисковый ввод-вывод (то есть приложение никогда не узнает о каких-либо проблемах с жестким диском). Использование файловой системы, поддерживающей оперативное исправление, устранит сообщения об ошибках, такие как FAT «Прервать, повторить попытку или сбой?» сообщение об ошибке, возникающее при обнаружении поврежденного сектора.

Версия HPFS, входящая в состав Windows NT, не поддерживает оперативное исправление.

Преимущества HPFS

HPFS лучше всего подходит для дисков емкостью 200–400 МБ. Дополнительные сведения о преимуществах HPFS см. в следующих материалах:

Windows NT Server "Концепции и руководство по планированию", глава 5, раздел "Выбор файловой системы"

Комплект ресурсов Windows NT Workstation 4.0, глава 18, "Выбор файловой системы"

Комплект ресурсов Windows NT Server 4.0 "Руководство по ресурсам", глава 3, раздел "Какую файловую систему использовать на каких томах"

Недостатки HPFS

Из-за накладных расходов, связанных с HPFS, это не очень эффективный выбор для тома менее примерно 200 МБ. Кроме того, при использовании томов размером более 400 МБ производительность может снизиться. Вы не можете установить безопасность на HPFS под Windows NT.

HPFS поддерживается только в Windows NT версий 3.1, 3.5 и 3.51. Windows NT 4.0 не может получить доступ к разделам HPFS.

Дополнительные недостатки HPFS см. в следующем:

Windows NT Server "Концепции и руководство по планированию", глава 5, раздел "Выбор файловой системы"

Комплект ресурсов Windows NT Workstation 4.0, глава 18, "Выбор файловой системы"

Комплект ресурсов Windows NT Server 4.0 "Руководство по ресурсам", глава 3, раздел "Какую файловую систему использовать на каких томах"

Обзор NTFS

С точки зрения пользователя, NTFS продолжает организовывать файлы в каталоги, которые, как и HPFS, сортируются. Однако, в отличие от FAT или HPFS, на диске нет «специальных» объектов и нет зависимости от базового оборудования, например секторов по 512 байт. Кроме того, на диске нет специальных мест, таких как таблицы FAT или суперблоки HPFS.

Цели NTFS – обеспечить:

Надежность, особенно желательная для высокопроизводительных систем и файловых серверов

Платформа для дополнительных функций

Поддержка требований POSIX

Снятие ограничений файловых систем FAT и HPFS

Надежность

Чтобы обеспечить надежность NTFS, были рассмотрены три основные области: возможность восстановления, устранение фатальных сбоев отдельных секторов и оперативное исправление.

NTFS — это восстанавливаемая файловая система, поскольку она отслеживает транзакции в файловой системе. Когда CHKDSK выполняется в FAT или HPFS, проверяется непротиворечивость указателей в таблицах каталогов, выделений и файлов. В NTFS ведется журнал транзакций для этих компонентов, так что CHKDSK нужно только откатить транзакции до последней точки фиксации, чтобы восстановить согласованность в файловой системе.

В FAT или HPFS, если произойдет сбой сектора, в котором находится один из специальных объектов файловой системы, произойдет сбой одного сектора. NTFS избегает этого двумя способами: во-первых, не используя специальные объекты на диске и отслеживая и защищая все объекты, находящиеся на диске. Во-вторых, в NTFS хранится несколько копий (количество зависит от размера тома) основной таблицы файлов.

Подобно версиям HPFS для OS/2, NTFS поддерживает оперативное исправление.

Добавлена ​​функциональность

Одной из основных целей разработки Windows NT на всех уровнях является предоставление платформы, которую можно добавлять и использовать, и NTFS не является исключением. NTFS предоставляет богатую и гибкую платформу для использования другими файловыми системами. Кроме того, NTFS полностью поддерживает модель безопасности Windows NT и поддерживает несколько потоков данных. Файл данных больше не является единым потоком данных. Наконец, в NTFS пользователь может добавлять в файл свои собственные определяемые пользователем атрибуты.

Поддержка POSIX

NTFS является наиболее совместимой с POSIX.1 из поддерживаемых файловых систем, поскольку она поддерживает следующие требования POSIX.1:

В POSIX README.TXT, Readme.txt и readme.txt — это разные файлы.

Дополнительная отметка времени:

Дополнительная отметка времени указывает время последнего доступа к файлу.

Жесткая ссылка — это когда два файла с разными именами, которые могут находиться в разных каталогах, указывают на одни и те же данные.

Снять ограничения

Во-первых, NTFS значительно увеличила размер файлов и томов, так что теперь они могут достигать 2^64 байт (16 эксабайт или 18 446 744 073 709 551 616 байт). NTFS также вернулась к концепции кластеров FAT, чтобы избежать проблемы HPFS с фиксированным размером сектора. Это было сделано потому, что Windows NT — переносная операционная система, и в какой-то момент могут встретиться различные дисковые технологии. Следовательно, 512 байт на сектор рассматривались как имеющие большую вероятность того, что они не всегда подходят для распределения. Это было достигнуто за счет возможности определения кластера как кратного размера естественного распределения аппаратного обеспечения. Наконец, в NTFS все имена файлов основаны на Unicode, а имена файлов 8.3 сохраняются вместе с длинными именами файлов.

Преимущества NTFS

NTFS лучше всего подходит для томов размером около 400 МБ и более. Это связано с тем, что производительность не снижается в NTFS, как в FAT, при больших размерах томов.

Возможность восстановления, предусмотренная в NTFS, такова, что пользователю никогда не придется запускать какую-либо утилиту восстановления диска в разделе NTFS. Дополнительные преимущества NTFS см. в следующем:

Windows NT Server "Концепции и руководство по планированию", глава 5, раздел "Выбор файловой системы"

Комплект ресурсов Windows NT Workstation 4.0, глава 18, "Выбор файловой системы"

Комплект ресурсов Windows NT Server 4.0 "Руководство по ресурсам", глава 3, раздел "Какую файловую систему использовать на каких томах"

Недостатки NTFS

Не рекомендуется использовать NTFS на томе размером менее примерно 400 МБ из-за того, что NTFS занимает много места. Эти накладные расходы связаны с системными файлами NTFS, которые обычно занимают не менее 4 МБ дискового пространства в разделе размером 100 МБ.

В настоящее время в NTFS нет встроенного шифрования файлов. Поэтому кто-то может загрузиться под MS-DOS или другой операционной системой и использовать низкоуровневую утилиту редактирования диска для просмотра данных, хранящихся на томе NTFS.

Невозможно отформатировать дискету с файловой системой NTFS; Windows NT форматирует все гибкие диски в файловой системе FAT, потому что служебные данные, связанные с NTFS, не помещаются на дискету.

Для дальнейшего обсуждения недостатков NTFS см. следующее:

Windows NT Server "Концепции и руководство по планированию", глава 5, раздел "Выбор файловой системы"

Комплект ресурсов Windows NT Workstation 4.0, глава 18, "Выбор файловой системы"

Комплект ресурсов Windows NT Server 4.0 "Руководство по ресурсам", глава 3, раздел "Какую файловую систему использовать на каких томах"

Соглашения об именах NTFS

Имена файлов и каталогов могут содержать до 255 символов, включая любые расширения. Имена сохраняют регистр, но не чувствительны к регистру. NTFS не различает имена файлов по регистру. Имена могут содержать любые символы, кроме следующих:

В настоящее время из командной строки можно создавать имена файлов длиной не более 253 символов.

Основные аппаратные ограничения могут налагать дополнительные ограничения на размер раздела в любой файловой системе. В частности, загрузочный раздел может иметь размер только 7,8 ГБ, а размер таблицы разделов ограничен 2 ТБ.

Дополнительную информацию о поддерживаемых файловых системах для Windows NT см. в наборе ресурсов Windows NT.

Способы управления данными компьютерами сильно изменились за последние несколько десятилетий. Сегодняшние пользователи воспринимают как должное многие преимущества системы баз данных. Однако не так давно компьютеры полагались на гораздо менее элегантный и дорогостоящий подход к управлению данными, называемый файловой системой.

Файловая система

Один из способов сохранить информацию на компьютере – это хранить ее в постоянных файлах. Система компании имеет ряд прикладных программ; каждый из них предназначен для манипулирования файлами данных. Эти прикладные программы были написаны по запросу пользователей в организации.Новые приложения добавляются в систему по мере необходимости. Только что описанная система называется системой на основе файлов.

Рассмотрите традиционную банковскую систему, использующую файловую систему для управления данными организации, показанную на рис. 1.1. Как мы видим, в банке есть разные отделы. Каждый из них имеет свои собственные приложения, которые управляют различными файлами данных и манипулируют ими. Для банковских систем программы могут использоваться для дебетования или кредитования счета, определения остатка на счете, добавления нового ипотечного кредита и создания ежемесячных отчетов.

<р> Рисунок 1.1. Пример файловой системы, используемой банками для управления данными.

Недостатки файлового подхода

Использование файловой системы для хранения организационной информации имеет ряд недостатков. Ниже перечислены пять примеров.

Избыточность данных

Часто внутри организации файлы и приложения создаются разными программистами из разных отделов в течение длительного периода времени. Это может привести к избыточности данных, ситуации, которая возникает в базе данных, когда поле необходимо обновить более чем в одной таблице. Эта практика может привести к нескольким проблемам, таким как:

  • Несоответствие формата данных.
  • Одна и та же информация хранится в нескольких разных местах (файлах)
  • Несогласованность данных — ситуация, когда различные копии одних и тех же данных конфликтуют, что приводит к нерациональному использованию места для хранения и дублированию усилий.

Изоляция данных

Изоляция данных — это свойство, определяющее, когда и как изменения, сделанные одной операцией, становятся видимыми для других одновременно работающих пользователей и систем. Эта проблема возникает в ситуации параллелизма. Это проблема, потому что:

  • Новым приложениям сложно получить нужные данные, которые могут храниться в различных файлах.

Проблемы целостности

  • Значения данных должны удовлетворять определенным ограничениям согласованности, указанным в прикладных программах.
  • Трудно вносить изменения в прикладные программы, чтобы ввести новые ограничения.

Проблемы безопасности

Безопасность может быть проблемой при файловом подходе, потому что:

  • Существуют ограничения на доступ к привилегиям.
  • Требования к приложениям добавляются в систему по мере необходимости, поэтому трудно обеспечить соблюдение ограничений.

Параллельный доступ

Параллелизм — это способность базы данных разрешать нескольким пользователям доступ к одной и той же записи без негативного влияния на обработку транзакций. Файловая система должна управлять или предотвращать параллелизм прикладных программ. Как правило, в файловой системе, когда приложение открывает файл, этот файл блокируется. Это означает, что в то же время никто другой не имеет доступа к файлу.

В системах баз данных параллелизм управляется, что позволяет нескольким пользователям получать доступ к одной и той же записи. Это важное различие между базой данных и файловой системой.

Подход к базе данных

Трудности, возникающие при использовании файловой системы, привели к разработке нового подхода к управлению большими объемами организационной информации, который называется подход к базе данных.

Базы данных и технологии баз данных играют важную роль в большинстве областей, где используются компьютеры, включая бизнес, образование и медицину. Чтобы понять основы систем баз данных, мы начнем с введения некоторых основных понятий в этой области.

Роль баз данных в бизнесе

Каждый так или иначе использует базу данных, даже если она просто хранит информацию о своих друзьях и семье. Эти данные могут быть записаны или сохранены на компьютере с помощью программы обработки текстов или сохранены в электронной таблице. Однако лучше всего хранить данные с помощью программного обеспечения для управления базами данных. Это мощный программный инструмент, который позволяет хранить, обрабатывать и извлекать данные различными способами.

Большинство компаний отслеживают информацию о клиентах, сохраняя ее в базе данных. Эти данные могут включать клиентов, сотрудников, продукты, заказы или что-либо еще, что помогает бизнесу в его деятельности.

Значение данных

Данные – это фактическая информация, такая как измерения или статистика об объектах и ​​концепциях. Мы используем данные для обсуждения или как часть расчета.Данные могут быть человеком, местом, событием, действием или чем-либо еще. Отдельный факт является элементом данных или элементом данных.

Если данные — это информация, а информация — это то, с чем мы работаем, вы можете начать понимать, где вы можете ее хранить. Данные могут храниться в:

  • Картотеки
  • Таблицы
  • Папки
  • Гроссбухи
  • Списки
  • Кучи бумаг на вашем столе

Все эти элементы хранят информацию, как и база данных. Из-за механической природы баз данных они обладают огромными возможностями для управления и обработки хранящейся в них информации. Это может сделать информацию, которую они хранят, гораздо более полезной для вашей работы.

Благодаря такому пониманию данных мы можем начать понимать, как инструмент, способный хранить коллекцию данных и упорядочивать их, проводить быстрый поиск, извлекать и обрабатывать, может повлиять на то, как мы можем использовать данные. Эта книга и последующие главы посвящены управлению информацией.

параллелизм: способность базы данных разрешать нескольким пользователям доступ к одной и той же записи без негативного влияния на обработку транзакций

элемент данных: отдельный факт или фрагмент информации

несогласованность данных: ситуация, когда разные копии одних и тех же данных конфликтуют

изоляция данных: свойство, определяющее, когда и как изменения, сделанные одной операцией, становятся видимыми для других одновременно работающих пользователей и систем

целостность данных: относится к обслуживанию и обеспечению правильности и согласованности данных в базе данных

избыточность данных: ситуация, возникающая в базе данных, когда поле необходимо обновить более чем в одной таблице

подход к базе данных: позволяет управлять большими объемами организационной информации

система на основе файлов: прикладная программа, предназначенная для управления файлами данных

  1. Обсудите каждый из следующих терминов:
    1. данные
    2. поле
    3. запись
    4. файл
      1. Сколько записей в таблице содержит файл?
      2. Сколько полей в записи?
      3. С какой проблемой вы бы столкнулись, если бы захотели создать список по городам?
      4. Как бы вы решили эту проблему, изменив структуру файла?

      Атрибуция

      Эта глава книги Проектирование базы данных (включая изображения, если не указано иное) является производной копией книги Нгуен Ким Ань "Концепции системы баз данных" под лицензией Creative Commons Attribution License 3.0

      Читайте также: