Если на диске хранятся сотни и тысячи файлов, то для удобства поиска используется

Обновлено: 01.07.2024

Заблокировано. Этот вопрос и ответы на него заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия.

Итак, я использую приложение, которое интенсивно хранит изображения в БД. Каков ваш взгляд на это? Я больше склонен хранить местоположение в файловой системе, чем хранить его непосредственно в БД.

Каковы, по вашему мнению, плюсы и минусы?

56 ответов 56

Я отвечаю за несколько приложений, которые управляют многотерабайтными изображениями. Мы обнаружили, что лучше всего хранить пути к файлам в базе данных.

Есть несколько проблем:

  • хранение базы данных обычно дороже, чем хранилище файловой системы
  • вы можете значительно ускорить доступ к файловой системе с помощью стандартных готовых продуктов
    • Например, многие веб-серверы используют системный вызов операционной системы sendfile() для асинхронной отправки файла непосредственно из файловой системы в сетевой интерфейс. Эта оптимизация не дает преимуществ изображениям, хранящимся в базе данных.
    • более сложно управлять целостностью между метаданными базы данных и данными файловой системы
    • трудно (в контексте веб-приложения) гарантировать, что данные были сброшены на диск в файловой системе

    @derobert: именно так, если вы никогда не будете использовать элемент данных в запросе, в качестве условия или для соединения, он, вероятно, не принадлежит базе данных. Опять же, если у вас есть хорошая функция базы данных для запроса изображений на сходство.

    Как и в большинстве случаев, это не так просто, как кажется. В некоторых случаях имеет смысл хранить изображения в базе данных.

    • Вы храните изображения, которые динамически меняются, например счета, и хотите получить счет на 1 января 2007 года?
    • Правительство хочет, чтобы вы сохранили 6-летнюю историю.
    • Изображения, хранящиеся в базе данных, не требуют другой стратегии резервного копирования. Изображения, хранящиеся в файловой системе, делают
    • Легче контролировать доступ к изображениям, если они находятся в базе данных. Бездействующие администраторы могут получить доступ к любой папке на диске. Чтобы извлечь изображения из базы данных, требуется действительно целеустремленный администратор.

    С другой стороны, есть проблемы, связанные

    • Требуется дополнительный код для извлечения и потоковой передачи изображений.
    • Задержка может быть меньше, чем при прямом доступе к файлу.
    • Большая нагрузка на сервер базы данных

    Отсутствие отдельной стратегии резервного копирования может иметь большое значение, если вы пишете приложения, устанавливаемые локально (например, SharePoint). Когда вы создаете резервную копию SharePoint, все находится в базе данных, что очень упрощает работу.

    Я не думаю, что он защищает безопасность за счет неизвестности — он говорит, что размещение изображений в БД добавляет еще один уровень безопасности. (Я думаю. @Conrad, не хочу вкладывать слова в свой рот)

    Я выбрал хранение изображений в базе данных из-за преимущества единой резервной копии (или, в более общем смысле, наличия всех данных в одном месте), но упомянутые вами проблемы также верны, поэтому я кэширую изображения в файловой системе. . Это лучшее из обоих миров, и я удивлен, что ни один из лучших ответов здесь не упоминает об этом.

    Хранилище файлов. Инженеры Facebook отлично поговорили об этом. Одним из выводов было знать практический предел файлов в каталоге.

    Это может быть немного далеко, но если вы используете (или планируете использовать) SQL Server 2008, я бы порекомендовал взглянуть на новый тип данных FileStream.

    FileStream решает большинство проблем, связанных с хранением файлов в БД:

    1. На самом деле Blob-объекты хранятся в виде файлов в папке.
    2. Доступ к BLOB-объектам можно получить с помощью либо подключения к базе данных или через файловую систему.
    3. Резервные копии интегрированы.
    4. Миграция "просто работает".

    Однако «Прозрачное шифрование данных» SQL не шифрует объекты FileStream, поэтому, если это необходимо, вам может быть лучше просто хранить их как varbinary.

    Из статьи MSDN:

    Инструкции Transact-SQL могут вставлять, обновлять, запрашивать, искать и создавать резервные копии данных FILESTREAM. Интерфейсы файловой системы Win32 обеспечивают потоковый доступ к данным.
    FILESTREAM использует системный кэш NT для кэширования файловых данных. Это помогает уменьшить влияние данных FILESTREAM на производительность ядра СУБД. Пул буферов SQL Server не используется; поэтому эта память доступна для обработки запросов.

    Кроме того, SQL-сервер позволяет получать доступ к большим двоичным объектам FileStream непосредственно с диска, чтобы вы могли не связывать соединение с БД

    Тем не менее, добавилась задержка между БД и веб-сервером. И веб-сервер должен будет загрузить его в память, чтобы передать клиенту, вместо того, чтобы передавать его с диска, если только вы не используете дисковое кэширование.

    Пути к файлам в БД — это, безусловно, правильный путь. Я слышал истории от клиентов с ТБ изображений о том, что попытки хранить любое значительное количество изображений в БД превратились в кошмар — один только удар по производительности слишком много.

    По моему опыту, иногда самое простое решение — назвать изображения в соответствии с первичным ключом. Таким образом, легко найти изображение, принадлежащее определенной записи, и наоборот. Но в то же время вы не сохраняете ничего об изображении в базе данных.

    Что-то очень похожее мы сделали с нашими документами с изображениями (наш первичный ключ представляет собой составной ключ из трех элементов), но мы добавили дату и время сканирования документа, чтобы иметь несколько версий в одном каталоге.< /p>

    @Osewa, Как дела? Да, для прямого доступа к файлу конечному пользователю потребуется доступ к папке. У вас может быть процесс для обслуживания файла через FTP на основе запроса, и безопасность будет на уровне SQL-сервера.

    Хитрость здесь в том, чтобы не стать фанатиком.

    Обратите внимание, что никто из сторонников файловых систем не указал конкретную файловую систему. Означает ли это, что любая база данных, от FAT16 до ZFS, с легкостью превосходит любую базу данных?

    Правда в том, что многие базы данных превосходят многие файловые системы, даже если мы говорим только о чистой скорости.

    Правильный план действий – принять правильное решение для вашего конкретного сценария, а для этого вам потребуются некоторые цифры и некоторые оценки вариантов использования.

    Я не вижу никого, кто утверждал бы, что файловая система быстрее БД в 100 % случаев (прочитайте ответ Марка Харрисона). Это немного соломенный человек. Вероятно, бывают ситуации, когда предпочтительнее не пристегиваться ремнем безопасности, но, вообще говоря, пристегиваться ремнем безопасности — хорошая идея.

    Там, где вы ДОЛЖНЫ гарантировать ссылочную целостность и соответствие требованиям ACID, необходимо хранить изображения в базе данных.

    Вы не можете транзакционно гарантировать, что изображение и метаданные об этом изображении, хранящиеся в базе данных, относятся к одному и тому же файлу. Другими словами, невозможно гарантировать, что файл в файловой системе будет изменен только в то же время и в той же транзакции, что и метаданные.

    На самом деле нет, можно. Поскольку файлы изображений никогда не удаляются, не изменяются и не перезаписываются после создания, все файлы изображений синхронизируются перед попыткой фиксации транзакций, файловая система не повреждена, вы можете быть уверены, что файлы изображений и метаданные синхронизированы. Думаю, для некоторых приложений это слишком много "если".

    Я бы пошел еще дальше и сказал, что с помощью файловой системы ведения журнала и некоторой дополнительной программной логики можно добиться совместимости с ACID. Шаги будут заключаться в записи записи БД, записи файла. Если файл зафиксирован, зафиксируйте транзакцию БД.

    Как уже говорили другие, SQL 2008 поставляется с типом Filestream, который позволяет вам хранить имя файла или идентификатор в качестве указателя в базе данных и автоматически сохраняет изображение в вашей файловой системе, что является отличным сценарием.

    Если вы работаете с более старой базой данных, я бы сказал, что если вы храните ее как данные BLOB-объектов, то вы действительно не сможете получить что-либо из базы данных для поиска объектов, поэтому вероятно, лучше хранить адрес в файловой системе и таким образом хранить изображение.

    Таким образом вы также сэкономите место в своей файловой системе, так как вы сэкономите только точное количество места или даже сжатое пространство в файловой системе.

    Кроме того, вы можете сохранить с некоторой структурой или элементами, которые позволят вам просматривать необработанные изображения в вашей файловой системе без каких-либо попаданий в базу данных, или переносить файлы в другую систему, на жесткий диск, в S3 или по другому сценарию — обновление местоположение в вашей программе, но сохраните структуру, опять же без особых усилий, пытаясь вывести изображения из вашей базы данных при попытке увеличить хранилище.

    Вероятно, это также позволит вам добавить некоторый элемент кэширования, основанный на часто используемых URL-адресах изображений, в ваш веб-движок/программу, так что вы там тоже сэкономите.

    Небольшие статические изображения (не более пары мегабайт), которые редко редактируются, должны храниться в базе данных. Этот метод имеет несколько преимуществ, включая более легкую переносимость (изображения передаются вместе с базой данных), более простое резервное копирование/восстановление (изображения резервируются вместе с базой данных) и лучшую масштабируемость (папка файловой системы с тысячами маленьких миниатюрных файлов кажется кошмаром масштабируемости для я).

    Я бы сказал, что база данных лучше подходит для файлов, которые часто редактируются, поскольку в этом случае могут возникнуть проблемы с непротиворечивостью.

    Вот интересный официальный документ по этой теме.

    Ответ: "Это зависит". Конечно, это будет зависеть от сервера базы данных и его подхода к хранилищу BLOB-объектов. Это также зависит от типа данных, хранящихся в больших двоичных объектах, а также от способа доступа к этим данным.

    Файлы меньшего размера можно эффективно хранить и доставлять, используя базу данных в качестве механизма хранения. Файлы большего размера, вероятно, лучше всего хранить с использованием файловой системы, особенно если они будут часто изменяться/обновляться. (фрагментация больших двоичных объектов становится проблемой с точки зрения производительности.)

    Есть еще один момент, о котором следует помнить. Одной из причин, поддерживающих использование базы данных для хранения BLOB-объектов, является соответствие требованиям ACID. Однако подход, использованный тестировщиками в официальном документе (вариант массового ведения журнала SQL Server), удвоивший пропускную способность SQL Server, фактически изменил букву «D» в ACID на «d», поскольку данные больших двоичных объектов не регистрировались с помощью начальная запись для транзакции. Поэтому, если полное соответствие требованиям ACID является важным требованием для вашей системы, уменьшите вдвое показатели пропускной способности SQL Server для операций записи в базу данных при сравнении файлового ввода-вывода с вводом-выводом больших двоичных объектов базы данных.

    Одна вещь, о которой я еще не слышал, но которую определенно стоит отметить, это то, что в большинстве файловых систем также возникают проблемы, связанные с хранением больших объемов изображений. Например, если вы воспользуетесь подходом, упомянутым выше, и назовете каждый файл изображения после первичного ключа, в большинстве файловых систем вы столкнетесь с проблемами, если попытаетесь поместить все изображения в один большой каталог, как только вы достигнете очень большого количества изображений ( например, сотни тысяч или миллионы).

    Одним из распространенных решений этой проблемы является объединение их в сбалансированное дерево подкаталогов.

    Вы могли бы так подумать, но проблемы на самом деле незначительны; У меня есть приложение с миллионами файлов в одном каталоге, к которому без проблем обращаются сотни пользователей. Это не умно, но это работает. Самая большая проблема заключается в том, что если вы используете проводник для просмотра каталога, вы будете вечно смотреть на фонарик.

    У меня было приложение с миллионами файлов в одном каталоге (сервер с RHEL 4). Даже для вывода списка содержимого каталога (конвейерная передача в файл) требовалось несколько дней и создавался выходной файл размером в 100 МБ. Теперь они находятся в базе данных. У меня есть один файл, который я могу легко переместить или сделать резервную копию.

    @Seun Osewa: у каждой файловой системы есть ограничения. и если вы знаете такой, у которого нет проблем с хранением миллионов записей в одном и том же каталоге, сообщите мне об этом !

    @Seun Osewa: размер базы данных сейчас достигает 28 ГБ, а количество записей — 5,4 М. В итоге мне пришлось разделить таблицу базы данных, поэтому у меня есть несколько файлов для резервного копирования размером около 5 ГБ. Теперь я перемещаю отдельные изображения на Amazon S3, поэтому мне нужно только сохранить имя файла в БД (и Amazon может делать резервные копии )

    О чем никто не упомянул, так это о том, что БД гарантирует атомарные действия, целостность транзакций и параллелизм. Даже ссылочная целостность файловой системы выходит за рамки окна — так как же узнать, что имена ваших файлов действительно по-прежнему верны?

    Если у вас есть изображения в файловой системе, и кто-то читает файл, когда вы пишете новую версию или даже удаляете файл, что происходит?

    Мы используем большие двоичные объекты, поскольку ими проще управлять (резервное копирование, репликация, передача). Они хорошо работают для нас.

    вам не нужны одновременные обновления, чтобы иметь проблемы — это может быть чтение и запись. В нашем случае это почти гарантированно произойдет.

    Проблема с хранением в базе данных только путей к файлам изображений заключается в том, что целостность базы данных больше не может быть обеспечена принудительно.

    Если фактическое изображение, на которое указывает путь к файлу, становится недоступным, в базе данных непреднамеренно возникает ошибка целостности.

    Учитывая, что изображения — это искомые фактические данные, и ими проще управлять (изображения не исчезнут внезапно) в одной интегрированной базе данных, а не взаимодействовать с какой-либо файловой системой (если файловая система при независимом доступе изображения МОГУТ внезапно «исчезнуть»), я бы предпочел сохранить их непосредственно как BLOB или что-то в этом роде.

    В компании, где я работал, мы хранили 155 миллионов изображений в базе данных Oracle 8i (затем 9i). 7,5 ТБ.

    Абсолютно. Судя по всему, база данных стала намного больше. Наличие данных в базе данных означает, что репликация базы данных на разных сайтах также намного проще.

    Я видел демонстрацию Oracle, где можно было подключить файловую систему к базе данных или что-то в этом роде. Вы знаете, если это то, что вы сделали? (Извините, я не разбираюсь в Oracle, поэтому, возможно, я говорю ерунду.)

    Я так не думаю - это хранило изображения в базе данных как в базе данных. База данных была агрессивно настроена — я помню многочисленные обсуждения изменения размера изображений при добавлении и удалении полей. Все было выровнено по границам.

    Обычно я категорически против того, чтобы брать самую дорогую и трудно масштабируемую часть вашей инфраструктуры (базу данных) и возлагать на нее всю нагрузку. С другой стороны: это значительно упрощает стратегию резервного копирования, особенно если у вас несколько веб-серверов и вам нужно как-то синхронизировать данные.

    Как и большинство других вещей, это зависит от ожидаемого размера и бюджета.

    Мы внедрили систему обработки изображений документов, в которой все изображения хранятся в полях больших двоичных объектов SQL2005. На данный момент существует несколько сотен ГБ, и мы наблюдаем отличное время отклика и незначительное снижение производительности или его полное отсутствие. Кроме того, для соблюдения нормативных требований у нас есть промежуточный уровень программного обеспечения, который архивирует недавно опубликованные документы в систему оптического музыкального автомата, которая предоставляет их как стандартную файловую систему NTFS.

    Мы очень довольны результатами, особенно в отношении:

    1. Простота репликации и резервного копирования
    2. Возможность легко внедрить систему управления версиями документов.

    Если это веб-приложение, может быть выгодно хранить изображения в сторонней сети хранения данных, такой как Amazon S3 или платформа Nirvanix.

    Допущение: приложение поддерживает работу в Интернете/доступно в Интернете

    Я удивлен, что никто не упомянул об этом . делегируйте это другим специалистам -> используйте стороннего хостинг-провайдера изображений/файлов.

    Храните свои файлы в платных онлайн-сервисах, например

    Здесь обсуждаются другие темы StackOverflow.

    В этой теме объясняется, почему вам следует использовать стороннего хостинг-провайдера.

    Это того стоит. Они эффективно хранят его. Нет пропускной способности, загружаемой с ваших серверов на запросы клиентов и т. д.

    Если вы не работаете с SQL Server 2008 и у вас есть веские причины помещать определенные файлы изображений в базу данных, вы можете выбрать "оба" подхода и использовать файловую систему в качестве временного кэша, а базу данных - в качестве главный репозиторий.

    Например, ваша бизнес-логика может проверять, существует ли файл изображения на диске, перед его подачей, извлекая его из базы данных при необходимости. Это дает вам возможность использовать несколько веб-серверов и меньше проблем с синхронизацией.

    +1 Это также позволяет сохранить исходное изображение, предоставляя кешированную/оптимизированную версию, позволяя позже изменить размер/сжатие

    Я не уверен, насколько это пример "реального мира", но в настоящее время у меня есть приложение, в котором хранятся данные для коллекционной карточной игры, включая изображения для карт. Учитывая, что количество записей в базе данных на сегодняшний день составляет всего 2851 запись, но, учитывая тот факт, что некоторые карты выпускаются несколько раз и имеют альтернативное изображение, на самом деле было более эффективно сканировать «основной квадрат» изображения, а затем динамически. генерировать рамку и различные эффекты для карты по запросу.

    Первоначальный создатель этой библиотеки изображений создал класс доступа к данным, который отображает изображение на основе запроса, и делает это довольно быстро для просмотра и отдельной карты.

    Это также упрощает развертывание/обновление при выпуске новых карт. Вместо того, чтобы архивировать всю папку с изображениями и отправлять их по конвейеру, обеспечивая создание правильной структуры папок, я просто обновляю базу данных, и пользователь загружает ее. опять таки. В настоящее время его размер составляет до 56 МБ, что не очень хорошо, но я работаю над функцией добавочного обновления для будущих выпусков. Кроме того, существует версия приложения "без изображений", которая позволяет тем, кто подключается по телефонной линии, получать приложение без задержки загрузки.

    На сегодняшний день это решение прекрасно работает, поскольку само приложение предназначено для использования в качестве единственного экземпляра на рабочем столе. Существует веб-сайт, на котором все эти данные заархивированы для онлайн-доступа, но я бы ни в коем случае не использовал для этого одно и то же решение. Я согласен, что доступ к файлам был бы предпочтительнее, потому что он лучше соответствовал бы частоте и объему запросов изображений.

    Надеюсь, это не слишком много болтовни, но я увидел тему и хотел поделиться своими мыслями об относительно успешном малом/среднем масштабе приложения.

    Раздел 404 Закона Сарбейнса-Оксли (SOX) требует, чтобы все публичные компании установили внутренний контроль и процедуры.

    Закон о защите конфиденциальности детей в Интернете от 1998 года (COPPA) – это федеральный закон, который налагает особые требования на операторов доменов .

    План North American Electric Reliability Corporation по защите критически важной инфраструктуры (NERC CIP) представляет собой набор стандартов.

    Взаимная аутентификация, также называемая двусторонней аутентификацией, представляет собой процесс или технологию, в которой оба объекта обмениваются данными .

    Экранированная подсеть или брандмауэр с тройным подключением относится к сетевой архитектуре, в которой один брандмауэр используется с тремя сетями .

    Метаморфное и полиморфное вредоносное ПО – это два типа вредоносных программ (вредоносных программ), код которых может изменяться по мере их распространения.

    Медицинская транскрипция (МТ) – это ручная обработка голосовых сообщений, продиктованных врачами и другими медицинскими работниками.

    Электронное отделение интенсивной терапии (eICU) — это форма или модель телемедицины, в которой используются самые современные технологии.

    Защищенная медицинская информация (PHI), также называемая личной медицинской информацией, представляет собой демографическую информацию, медицинскую .

    Снижение рисков – это стратегия подготовки к угрозам, с которыми сталкивается бизнес, и уменьшения их последствий.

    Отказоустойчивая технология — это способность компьютерной системы, электронной системы или сети обеспечивать бесперебойное обслуживание.

    Синхронная репликация — это процесс копирования данных по сети хранения, локальной или глобальной сети, поэтому .

    Интерфейс управления облачными данными (CDMI) – это международный стандарт, определяющий функциональный интерфейс, используемый приложениями.

    Износ флэш-памяти NAND — это пробой оксидного слоя внутри транзисторов с плавающим затвором флэш-памяти NAND.

    Выносливость при записи — это количество циклов программирования/стирания (P/E), которое может быть применено к блоку флэш-памяти перед сохранением .

    Помогите своему бизнесу сэкономить место на диске и ускорить передачу электронной почты с помощью ZIP-файлов.


    Что такое ZIP-файл?

    Сжатие файлов — важная часть цифрового рабочего пространства. Файлы ZIP используют сжатие для отправки большего количества данных с более высокой скоростью, чем когда-либо. Вот почему ZIP-файлы являются таким популярным инструментом для бизнеса во всем мире. Но что такое ZIP-файл?

    ZIP — это распространенный формат файлов, используемый для сжатия одного или нескольких файлов в одном месте. Это уменьшает размер файла и упрощает его транспортировку или хранение. Получатель может разархивировать (или извлечь) файл ZIP после транспортировки и использовать файл в исходном формате.

    Файлы ZIP работают почти так же, как стандартные папки на вашем компьютере. Они содержат данные и файлы вместе в одном месте. Но в заархивированных файлах содержимое сжимается, что уменьшает объем данных, используемых вашим компьютером. Другой способ описать ZIP-файлы — это архив. Архив содержит все сжатые файлы в одном месте. Таким образом, формат файла ZIP является одним из вариантов использования, если вам нужно уменьшить размер одного файла или группы файлов.

    Итак, как идентифицировать файл ZIP-архива? Простой. Всякий раз, когда вы видите расширения .ZIP или .zip в конце имени файла, вы просматриваете ZIP-файл. Значок, представляющий файл, также изменится. Скажем, у вас есть фотография с именем Vacation.jpg. После того, как вы заархивируете эту фотографию, она теперь будет называться Vacation.zip и иметь новый значок.

    Отличается ли ZIP от 7-ZIP или RAR?

    При поиске ZIP-файлов вы можете встретить термин "файл 7z" или "7-ZIP". Это формат архивации, который использует более высокую степень сжатия для меньшего количества мегабайт. Хотя этот меньший размер является положительным моментом, он также требует больше времени для обработки. Это также менее удобно, поскольку для использования вам необходимо загрузить и установить программное приложение. Это также касается файлов RAR и TAR, а также сторонних программных приложений WinRAR, ZIPx и PeaZip.

    Как работают ZIP-файлы?

    ZIP-файлы кодируют информацию в меньшее количество битов, удаляя лишние данные. Это «сжатие данных без потерь» гарантирует целостность всех исходных данных. Давайте рассмотрим краткий пример, чтобы объяснить, как это работает.

    Представьте себе файл, содержащий следующие предложения:

    • Лучшее решение для совместного использования и хранения данных для вашего бизнеса.
    • Ваше бизнес-решение для лучшего обмена и хранения

    Каждое слово в этом файле встречается дважды. Теперь, если каждая буква и пробел в предложении равны одной единице памяти, тогда весь размер файла составит 110 единиц. Но вы можете создать числовой код, чтобы выразить данные по-другому:

    • Лучшее решение для совместного использования и хранения данных для вашего бизнеса.
    • 123456789

    Или, другими словами, оба предложения теперь будут выглядеть так: 123456789896712345. Это означает, что первоначальный размер файла со 110 единиц уменьшается до 18 единиц, что является значительной экономией. Именно для этого в формате файла ZIP используются алгоритмы сжатия без потерь. Это позволяет более эффективно выражать ту же информацию, удаляя избыточные данные из файла. Это также означает, что отправлять ZIP-файлы быстрее.

    Когда использовать ZIP-файлы на работе

    Существует множество потенциальных применений архивных файлов в бизнес-среде. Возможность отправки большого количества файлов по электронной почте крайне важна. Скажем, вам нужно отправить большой пакет файлов коллеге или клиенту. Если вы попытаетесь отправить их все сразу во вложении электронной почты, вы получите сообщение об ошибке из-за размера файла. Таким образом, вы можете попробовать отправить каждый файл как отдельные электронные письма. Но это занимает много времени, требует больших усилий и может привести к дублированию файлов. Чтобы отправить все файлы в одном электронном письме, вы можете заархивировать их и прикрепить этот единственный ZIP-файл к своему электронному письму. Затем ваш получатель может разархивировать файл, загрузив его и щелкнув.

    Вы также должны учитывать любую потенциальную экономию места в хранилище. Архивирование файлов может помочь уменьшить объем занимаемого ими места на жестком диске вашего компьютера.

    Дополнительную информацию о том, как архивировать файлы, можно найти здесь.

    Каковы преимущества и недостатки формата файла ZIP?

    Преимущества

    Во-первых, сжатые файлы экономят место на диске и повышают эффективность работы вашего компьютера. Это также эффективный способ улучшить передачу файлов по электронной почте. Вы можете отправлять электронные письма быстрее с файлами меньшего размера. Кроме того, формат файла ZIP зашифрует ваши данные. Это обеспечивает вашу конфиденциальность при отправке файлов через Интернет. Короче говоря, это простой способ максимально повысить эффективность работы с файлами. Это также довольно простой процесс создания ZIP-файла на Mac или ПК. Windows и Mac OS имеют другой метод, но оба они начинаются с правого щелчка. А для получателей просто распаковать файлы. Все, что для этого требуется, — это загрузить и щелкнуть мышью независимо от операционной системы компьютера.

    Недостатки

    Однако существует ряд потенциальных проблем, связанных с ZIP-файлами. К ним относятся ограничения на размер файлов, ограничения на типы файлов, проблемы с повреждением и мобильностью.

    Одним из многих недостатков, связанных с ZIP-архивами, являются ограничения на сжатие. Некоторые файлы не могут быть сжаты намного больше, чем они уже есть. Это особенно верно для файлов MP3 и файлов JPG. Таким образом, если вы часто работаете с видеофайлами и файлами изображений, формат ZIP не поможет вам сэкономить много места для хранения.

    Вам также необходимо подумать об аспекте безопасности заархивированных файлов. Готовые заархивированные файлы зашифрованы, но вы не знаете, что произойдет с вашим файлом, если вы загрузите стороннее приложение. Также стоит помнить, что расширения файлов ZIP также могут быть повреждены. В некоторых случаях поврежденные данные могут затронуть всю папку ZIP.

    Файлы ZIP также сложно использовать, если вы находитесь в дороге. Если вы используете телефон или планшет, вам нужно будет использовать файл, сохраненный на вашем телефоне, и стороннее приложение. Это создаст проблемы как с местом для хранения файлов, так и с безопасностью.

    Каковы альтернативы ZIP-файлам?

    Облачное хранилище — лучшая альтернатива ZIP-файлам. Облако Dropbox полностью избавляет от необходимости сжатия. Вам не нужно выполнять долгий многоэтапный процесс для хранения или отправки больших файлов. Просто нажмите «Поделиться», чтобы отправить файл или папку в исходном размере, без сжатия. Вы можете хранить и обмениваться файлами размером до 50 ГБ. Dropbox — это быстрый и надежный способ обмениваться файлами, не используя электронную почту и не занимая место на диске вашего компьютера. И если вам все еще нужно работать со сжатыми файлами, Dropbox тоже может это сделать! Dropbox предлагает предварительный просмотр ZIP и RAR, сжатие после загрузки и редактирование.

    Последнее слово

    Короче говоря, ZIP-файл – это более эффективный способ хранения или передачи данных. Но это не единственный способ сжатия файлов или экономии места. Теперь, когда у нас есть Dropbox, облако делает хранение файлов и обмен ими быстрее, проще и безопаснее, чем сжатие файлов.

    Студенты учатся в кружке

    Я надеюсь поступить в университет в этом году и ищу ноутбук. В чем разница между SSD и HDD и что лучше для студента? Из того, что я видел, вы можете получить примерно в четыре раза больше места на жестком диске, чем на SSD, по той же цене, поэтому кажется, что HDD будет лучшим вариантом. Джеймс

    Рынок ноутбуков переходит от традиционных жестких дисков (HDD) со "вращающейся ржавчиной" к твердотельным накопителям (SSD) на базе чипов по нескольким причинам. SSD более отзывчивы; они потребляют меньше энергии батареи; они реже ломаются при падении и занимают намного меньше места.

    Главное преимущество — отзывчивость. SSD-накопители делают такие действия, как загрузка и сохранение программ и файлов, намного быстрее.

    В ноутбуках жесткий диск не вращается постоянно, чтобы экономить энергию и продлить срок службы батареи. Когда программе нужны данные с жесткого диска, она должна ждать, пока жесткий диск не раскрутится, что вызывает небольшую задержку. Когда программа извлекает данные с SSD, ей не нужно ждать: они доступны практически мгновенно.

    Недостаток всегда был и остается в цене. Хранилище на твердотельном накопителе стоит намного дороже, чем на жестком диске, и раньше это соотношение было намного выше. Вот почему переход занял уже более двух десятилетий. Однако каждый раз, когда цены на флэш-память падают, твердотельные накопители дешевеют, и все больше людей готовы платить разницу в цене.

    Если вы можете позволить себе SSD, это то, что вам нужно.

    Какая польза?

    Конечно, использование твердотельных накопителей означает, что большинству людей приходится обходиться гораздо меньшим объемом памяти.Ноутбук может поставляться с твердотельным накопителем на 128 ГБ или 256 ГБ вместо жесткого диска на 1 ТБ или 2 ТБ. На жестком диске емкостью 1 ТБ хранится в восемь раз больше, чем на твердотельном накопителе емкостью 128 ГБ, и в четыре раза больше, чем на твердотельном накопителе емкостью 256 ГБ. Главный вопрос заключается в том, сколько вам действительно нужно.

    На самом деле другие разработки помогли компенсировать меньшую емкость твердотельных накопителей.

    Например, многие люди теперь хранят больше данных в облаке, используя онлайн-сервисы, такие как Microsoft OneDrive, Google Диск и Dropbox, а не на своих ноутбуках. Преимущество заключается в том, что вы можете получить доступ к своим онлайн-файлам с других устройств, включая настольные ПК, ноутбуки, планшеты и смартфоны.

    У некоторых людей есть домашние медиасерверы или файловые серверы NAS (сетевое хранилище). Если у вас есть тысячи музыкальных файлов, тысячи фотографий и сотни фильмов, они, вероятно, не поместятся на ноутбуке. Решение состоит в том, чтобы поместить их на NAS, который будет транслировать их на ваш телевизор, ПК и другие устройства. (См. Какой NAS следует купить для хранения файлов?)

    Планируйте свое хранилище

    Когда вы учитесь в университете или колледже, вам нужно будет позаботиться о большом количестве файлов». ширина =

    Когда вы поступаете в университет или колледж, вам нужно будет следить за большим количеством файлов. Фотография: Caiaimage/Sam Edwards/Getty Images/Caiaimage

    Когда вы поступаете в университет или колледж, вам нужно будет следить за большим количеством файлов. То, как вы решите это сделать, должно повлиять на ваш выбор ноутбука.

    Во-первых, у вас будут важные файлы, такие как эссе и фоновые исследования. Очень важно создать их резервную копию на случай, если ваш ноутбук выйдет из строя, будет потерян или украден. Для этого вы можете хранить копии на внешнем жестком диске USB, купленном для этой цели, на флэш-накопителях USB, на крошечных SD-картах, которые вы можете безопасно хранить, и в Интернете. (Если вы получите учетную запись Office 365 — бесплатно для студентов — у вас будет 1 ТБ онлайн-хранилища.) Вы даже можете хранить резервные копии на компакт-дисках или DVD-дисках. В настоящее время это менее распространено, но в некоторых ноутбуках все еще есть DVD-приводы, или вы можете добавить дешевую внешнюю версию.

    Во-вторых, у вас будут личные файлы, например фотографии, музыка, фильмы и игры. Вы должны сделать их резервную копию на внешнем жестком диске, а резервные копии незаменимых также должны быть сохранены в Интернете, на оптических носителях или где-то еще. (На самом деле многие медиафайлы можно заменить.)

    Сегодня SD-карты емкостью 64 ГБ и внешние жесткие диски емкостью 4 ТБ стоят дешево, а диски емкостью 8 ТБ доступны по цене. Если у вас много внешней памяти, вам может не понадобиться столько места на ноутбуке. Но если вы играете в какие-нибудь более крупные компьютерные игры, вы, вероятно, так и сделаете.

    Чипсы со всем

    Существует как минимум четыре типа накопителей для ноутбуков, а не два. Многие дешевые машины не имеют ни жесткого диска, ни твердотельного накопителя, вместо этого они используют чипы eMMC. Это вариант карт памяти MMC (Multi-Media Card) и SD (Secure Digital), которые стали обычным явлением в цифровых камерах и смартфонах. Те, что в ноутбуках и планшетах, обычно предлагают 32 ГБ или 64 ГБ памяти, хотя 32 ГБ могут привести к проблемам при обновлении Windows 10.

    Очевидно, что «накопители» eMMC не так быстры, как SSD, но они работают достаточно хорошо для своих целей.

    Твердотельные накопители потребительского уровня начинались как замена традиционным жестким дискам. Обычно они поставлялись в корпусах, которые подходили к одним и тем же отсекам для дисков, что упрощало замену жесткого диска на твердотельный накопитель. Это по-прежнему возможно с некоторыми современными ноутбуками и многими старыми.

    Однако появление флэш-чипов большой емкости означало, что их можно было подключать к материнской плате, что избавляло от необходимости в громоздких корпусах размером с жесткий диск. Это позволило поставщикам ПК производить более тонкие и легкие ноутбуки.

    Ранние твердотельные накопители этого типа часто использовали ту же компоновку, что и карты PCI Express Mini. Слот PCIe уже использовался для беспроводных и сетевых карт, видеокарт, дисковых контроллеров и других целей, так что это был хорошо известный формат. Однако сейчас мы переходим на карту M.2, оптимизированную для хранения SSD. (Модули M.2 могут быть длиннее, и вы можете устанавливать чипы с обеих сторон карты, что удваивает объем памяти на одном и том же пространстве.) M.2 поддерживает PCI Express, Serial ATA и USB 3.0, а SSD обычно использовать PCIe.

    Если ваши глаза затуманились, просто помните, что наилучшие результаты дает использование M.2 и PCIe с драйверами и контроллерами NVM Express (NVMe). NVMe был разработан специально для хранения на твердотельных накопителях и работает с твердотельными накопителями в отсеках для дисков, а не только с версиями, монтируемыми на карту.

    Прежде чем купить ноутбук, проверьте, какой объем памяти он использует. Можно ли заменить SSD или HDD, если он выйдет из строя? Сможете ли вы обновить его, когда цены на диски снизятся?

    Если чипы памяти припаяны к материнской плате, предположим, что ваши программы и данные умрут вместе с вашим ноутбуком, хотя Apple может извлечь их из некоторых моделей.

    Гибридные диски

    Если вам нужен ноутбук с более быстрым откликом и большим объемом памяти, рассмотрите гибридный диск, сочетающий в себе эти два качества. Seagate называет их SSHD (твердотельные гибридные диски).

    У гибридных накопителей есть контроллеры, которые управляют как жестким диском, так и микросхемами флэш-памяти, образующими твердотельный накопитель, поэтому они отображаются как один накопитель. SSHD со временем узнает, какие файлы должны быть на SSD для быстрого доступа, а какие файлы могут оставаться на традиционном жестком диске.

    Гибридные диски приближаются к твердотельным накопителям (но не соответствуют им) по скорости, но ближе к жестким дискам по цене.

    Для удобства микросхемы SSD можно упаковать вместе с жестким диском. Однако иногда SSD помещается в слот M.2 NVMe или аналогичный. Например, мой настольный компьютер Dell XPS имеет традиционный жесткий диск емкостью 1 ТБ с 16 ГБ памяти Intel Optane, который работает как дешевый «ускоритель жесткого диска». (На настольном компьютере с питанием от сети вы можете поддерживать вращение жесткого диска, поэтому твердотельный накопитель меньше влияет на скорость отклика.)

    Мимоходом, Microsoft пробовала аналогичные идеи с ReadyDrive и ReadyBoost в Windows, начиная с Vista в 2006 году.

    Гибридные диски так и не стали популярными, а поскольку цены на твердотельные накопители падают, их дни сочтены. Однако, если вам действительно нужно 500 ГБ или 1 ТБ доступного хранилища, они будут быстрее, чем жесткие диски без ускорения.

    Читайте также: