Файлы каких типов обычно хорошо сжимаются

Обновлено: 21.11.2024

Сжатие файлов используется для уменьшения размера одного или нескольких файлов. Когда файл или группа файлов сжаты, полученный «архив» часто занимает на диске на 50–90 % меньше места, чем исходный файл (файлы). Общие типы сжатия файлов включают сжатие Zip, Gzip, RAR, StuffIt и 7z. Каждый из этих методов сжатия использует уникальный алгоритм для сжатия данных.

Так как же на самом деле утилита сжатия файлов сжимает данные? Хотя каждый алгоритм сжатия отличается, все они работают одинаково. Цель состоит в том, чтобы удалить избыточные данные в каждом файле, заменив общие шаблоны меньшими переменными. Например, слова в текстовом документе могут быть заменены числами или другим типом короткого идентификатора. Затем эти идентификаторы ссылаются на исходные слова, сохраненные в ключе в сжатом файле. Например, слово «компьютер» можно заменить цифрой 5, которая занимает гораздо меньше места, чем слово «компьютер». Чем больше раз слово «компьютер» встречается в текстовом документе, тем эффективнее будет сжатие.

Хотя сжатие файлов хорошо работает с текстовыми файлами, двоичные файлы также могут быть сжаты. Находя повторяющиеся двоичные шаблоны, алгоритм сжатия может значительно уменьшить размер двоичных файлов, таких как приложения и образы дисков. Однако, как только файл сжат, его необходимо распаковать, чтобы использовать. Поэтому, если вы загружаете или получаете сжатый файл, вам нужно будет использовать программу распаковки файлов, такую ​​как WinZip или StuffIt Expander, чтобы распаковать файл, прежде чем вы сможете просмотреть исходное содержимое.

Связанные расширения файлов: .ZIP, .GZ, .RAR, .SITX, .7Z.

Хотите узнать больше технических терминов? Подпишитесь на ежедневный или еженедельный информационный бюллетень и получайте избранные термины и тесты на свой почтовый ящик.

Технический фактор

Подпишитесь на бесплатную рассылку новостей TechTerms

Спасибо

Мы только что отправили вам электронное письмо для подтверждения вашего адреса электронной почты. Как только вы подтвердите свой адрес, вы начнете получать информационный бюллетень.

Некоторые типы файлов сжимаются лучше, чем другие. Некоторые файлы данных, такие как текстовые файлы, файлы изображений в формате BMP и некоторые файлы базы данных в текстовом стиле, часто могут быть сжаты на 90% или более. Существуют и другие типы файлов, например файлы программ, которые могут сжиматься примерно на 50 %. Узнайте, как создать ZIP-файл.

Есть и другие типы файлов, которые часто плохо сжимаются. Например, большинство мультимедийных файлов не будут сильно сжиматься, поскольку они уже существуют в сильно сжатом состоянии. Эти типы файлов обычно используют эффективные методы сжатия содержащихся в них данных. Примеры включают, помимо прочего, графические файлы (изображения) (GIF, JPG, PNG и т. д.), музыкальные файлы (MP3, WMA и т. д.) и файлы фильмов (AVI, MPG и т. д.). Файлы, которые сжаты, как в этих примерах, обычно не могут быть сжаты до сколько-нибудь существенной степени. Таким образом, такие файлы не становятся намного меньше, если они вообще становятся меньше, когда они добавляются в Zip-файл (.zip или .zipx).

Вы увидите аналогичное отсутствие сжатия, если заархивируете некоторые файлы с максимальным сжатием, а затем добавите этот Zip-файл в другой Zip-файл. Этот второй Zip-файл не будет существенно меньше первого (он может быть даже немного больше). Опять же, это связано с тем, что данные в исходном Zip-файле уже сжаты. Некоторые файлы документов, в том числе созданные Microsoft Office, на самом деле представляют собой ZIP-файлы с пользовательским расширением.

Есть и другие типы файлов, которые плохо сжимаются. Например, некоторые типы зашифрованных файлов данных, например те, которые используются в программах домашних финансов и некоторых продуктах для работы с электронными таблицами, не будут сильно сжиматься.

Опять же, если вы создаете Zip-файлы и видите файлы, которые нельзя значительно сжать, это, вероятно, потому, что они уже содержат сжатые данные или они зашифрованы.

Если вы хотите поделиться файлом или несколькими файлами, которые плохо сжимаются, вы можете:

  • Отправлять фотографии по электронной почте, архивируя и изменяя их размер.
  • Используйте WinZip Express для Explorer, чтобы заархивировать файлы, загрузить их в облачный сервис и отправить ссылку для скачивания по электронной почте.
  • Отправьте по электронной почте ссылку на файлы, которые вы уже загрузили в облачный сервис.

Если у вас есть какие-либо вопросы по поводу этой информации, отправьте запрос в службу технической поддержки.

Сжатие полезно не только при совместном использовании больших файлов, но и упрощает работу с коллекциями файлов как с единым сжатым пакетом.

Существует множество инструментов и опций программного обеспечения для сжатия. В этом Data Nudge представлены четыре распространенных формата сжатых (заархивированных) файлов, которые широко используются в исследованиях.

4 распространенных формата сжатых/заархивированных/сгруппированных файлов, используемых в исследованиях

ZIP (.zip): наиболее часто используемый сжатый формат.
↳ Самая высокая скорость сжатия, но самая низкая степень сжатия
↳ Встроено в машины Windows
↳ Распространено в системах Linux/Posix

TAR (.tar): используется для хранения нескольких файлов в одном файле, который иногда называют «архивом».
↳ Не сжимает
↳ Может упростить обработку и передачу сложных структур каталогов
↳ Распространено в системах Linux/Posix
↳ Может использоваться в Windows с использованием 7-zip или на Mac OS X с помощью Unarchiver

GZIP (.gz): используется для сжатия архивных файлов tar. Расширению файла .gz может предшествовать расширение другого формата, например, .tar.gz (иногда сокращается до .tgz) или .txt.gz.
↳ Высокая скорость сжатия и немного более высокая степень сжатия, чем у ZIP
↳ Распространено в системах Linux/Posix
↳ Может использоваться в Windows с использованием 7-zip или в Mac OS X с использованием Unarchiver

7Z (.7z): формат с высокой степенью сжатия.
↳ Самый высокий коэффициент сжатия, но самая низкая скорость сжатия
↳ Можно разделить один архив на более мелкие фрагменты
↳ Обычно для Windows, Mac OS X и Linux
↳ Версия для командной строки может быть используется в Linux/Posix с использованием p7zip
↳ Можно использовать в Windows с помощью 7-zip или в Mac OS X с помощью Unarchiver

Когда файлы плохо сжимаются

Другие файлы и большинство мультимедиа часто плохо сжимаются, потому что они уже существуют в сильно сжатом состоянии, примеры включают, но не ограничиваются:
⚠ аудио (MP3, WMA и т. д.)
⚠ видео ( AVI, MPG и т. д.)
⚠ изображения (JPG, PNG, GIF и т. д.)
⚠ зашифрованные файлы

Поэтому вы не увидите результатов сжатия, позволяющих сэкономить место, как при работе с текстовыми файлами или другими ранее несжатыми форматами. На самом деле, он может даже стать больше.

Подтолкнуло ли вас к действию Data Nudge?
Расскажите нам об этом, используя эту форму обратной связи , и мы вышлем вам подарочный пакет
Research Data Service!

Почему некоторые файлы не могут быть эффективно сжаты?

    Образы дисков/диски виртуальных машин (QCOW2, VMDK, Microsoft VHD, VDI) часто содержат данные, которые необходимо очистить, такие как файлы корзины, временные файлы, содержимое ОЗУ (если машина была остановлена, а не выключена) и данные стертых данных. файлы, все еще записанные в секторах диска, если свободное место не перезаписано нулем - не отображается в занятии диска при запуске образа, а помечается как свободное место после удаления. Базы данных могут содержать удаленные записи, пока не будут очищены соответствующими действиями для определенного формата базы данных; Кроме того, перед архивированием/резервным копированием базы данных рекомендуется выполнить надлежащие процедуры дублирования данных. Резервное копирование следует проверять, чтобы уменьшить количество дубликатов или временных файлов. Стратегия инкрементного резервного копирования (сохранение только файлов, измененных между двумя контрольными точками резервного копирования) может использоваться для значительного уменьшения размера наборов резервных копий.
    Файлы документов (MS Office DOCX, Adobe Acrobat PDF. ) могут содержать данные устаревших редакций или мультимедийные данные, не соответствующие разрешению документа, который должен быть создан с более подходящим определением/размером либо в исходных мультимедийных файлах, или во время редактирования документа.
    Даже если несжатая графика и мультимедиа могут содержать высокий уровень энтропии энтропии как в графических/видео, так и в аудиоданных (например, файлы BMP, RAW, WAV и AVI), это следует точно учитывать, например, плохое качественный фотосенсор или неподходящий микрофон могут привести к низкому соотношению сигнал/шум, что приведет к плохому результату загрузки и плохому сжатию данных.

    Как уменьшить размер данных перед сжатием

    Примеры уже сжатых форматов файлов

    Графические файлы, такие как JPEG и PNG, обычно плохо сжимаются по сравнению с несжатыми растровыми изображениями, такими как файлы RAW, BMP и несжатые файлы TIFF (узнайте больше о том, как оптимизировать сжатие изображений и медиафайлов).
    Аудиофайлы в формате MP3 обычно очень плохо сжимаются по сравнению с несжатыми аудиоформатами, такими как файлы WAV.
    Мультимедийные видеофайлы, такие как AVI, DIVX, MPEG, MKV. очень плохо сжимаются с помощью алгоритмов сжатия без потерь общего назначения, используемых в программном обеспечении для архивирования / резервного копирования файлов, и должны быть перекодированы (возможно, из источника максимально возможного качества) с более эффективным алгоритмом сжатия аудио / видео с потерями - например. кодирование несжатого AVI с H.264, H.265 или H.256 в формат MPEG-4/MP4, MKV или WebM, а не в устаревшие стандарты MPEG-1 или MPEG-2.
    Некоторые типы документов, такие как Adobe Acrorbat PDF, форматы Open Office и новые форматы файлов Microsoft Office (DOCX, XLSX, PPTX.), а также некоторые базы данных, содержат уже сжатые данные (обычно с использованием сжатия без потерь, разработанного на основе алгоритма Deflate), и, как правило, плохо сжимается по сравнению со старыми несжатыми форматами документов, такими как DOC, XLS, PPT.
    Обратите внимание, что документ или база данных сами по себе являются контейнером, поэтому, если они хранят сжатые растровые изображения и другие мультимедийные данные, в качестве примера они будут плохо сжиматься по сравнению с файлом того же формата, содержащим простые текстовые данные, это причина, по которой даже некоторые несжатые документы (DOC, XLS, PPT) сжимаются меньше, чем другие документы того же типа.

    Возможные решения для сжатия уже сжатых файлов

      Извлеките существующие архивы (ZIP, ACE, . ) и повторно сожмите содержимое в более мощном формате сжатия, таком как RAR или 7Z: в этом случае окончательные архивы будут меньше исходных (в зависимости от характера входных данных) , а попытки сжатия архивов не дадут сопоставимых результатов. PeaZip может автоматизировать извлечение и повторное сжатие существующих архивов, используя более сильное сжатие, используя свой инструмент преобразования файлов.
    1. В некоторых случаях встроенное сжатие формата файла представляет собой компромисс между необходимостью уменьшить окончательный размер файла и необходимостью быстрого доступа к содержимому файла, избегая чрезмерно мощных и сложных алгоритмов сжатия. В этих случаях (например, файлы JPEG, PDF, DOCX, XLSX) применение мощного сжатия (например, сжатие в RAR или 7Z) может уменьшить размер этих файлов.
    2. В худшем случае дальнейшее улучшение текущего уровня сжатия файлов просто невозможно, и следует рассмотреть другие стратегии, например, использовать такие утилиты, как PeaZip, для дедупликации файлов (поиск идентичных файлов, чтобы избежать архивирования/резервного копирования нескольких копий одни и те же данные) или разделить выходной архив на несколько томов желаемого размера, если это необходимо для сохранения выходных данных в соответствии с обязательными максимальными размерами (т. е. максимальный размер вложения электронной почты, максимальный размер загружаемых файлов, ограничения файловой системы или встроенные ограничения размера файла , так далее). Кроме того, в этих случаях может быть полезно выбрать более низкие параметры сжатия (или архивирование без сжатия, параметр, обычно обозначаемый как уровень сжатия «хранить»), что сэкономит время и вычислительную мощность без практического влияния на окончательный размер файла.< /li>

      Примеры несжимаемых типов файлов

      Шифрование можно использовать для защиты многих типов баз данных, файлов резервных копий, некоторых форматов документов, таких как PDF, и это распространенный вариант защиты архивов. Форматы архивов, поддерживающие строгие стандарты шифрования, – 7Z, PEA, RAR, ZIP и ZIPX.

      Возможные решения для уменьшения занимаемого места несжимаемыми файлами

      Краткий обзор: Почему некоторые файлы не сжимаются? Почему сжатие файлов некоторых форматов (jpeg, pdf, docx) приводит к плохому сжатию? Почему мультимедийные файлы (avi, mp3, mpeg mkv) не могут быть эффективно сжаты в архивах и резервных копиях? Почему zip-файлы нельзя сжимать дальше? Почему зашифрованные данные нельзя сжать?

      Темы: почему некоторые файлы нельзя сжать, сжатие медиафайлов, нельзя сжать уже сжатые файлы, несжимаемые файлы, случайные или зашифрованные

      PeaZip > FAQ > Почему я не могу сжать некоторые типы файлов, такие как avi, mp3, pdf

      Давайте поговорим о сжатии файлов. Мы начнем с простого и укажем вам папку в проводнике Windows.


      Тот самый.Это заархивированная папка — на самом деле сжатый файл, содержащий папку. Не путайте пока. Дело в том, что существует более одного типа сжатия файлов — на самом деле их много, и .zip — самый популярный только потому, что он встроен в Windows.

      Сжатые файлы используются пользователями по всему Интернету для ускорения загрузки и экономии места. Вы можете создать свои собственные сжатые файлы, если что-то, что вы хотите перенести с одного компьютера на другой, не помещается на устройстве, которое вы используете для передачи — например, ваша коллекция фильмов слишком велика для вашей флешки. Точно так же люди, размещающие загрузки файлов, обычно сжимают их, чтобы они занимали меньше места при хранении, а также быстрее загружались и загружались — это беспроигрышная ситуация. Если вы хотите узнать больше об онлайн-хостинге, узнайте больше о платформе хостинга wordpress по ссылке.

      Чтобы легко создать сжатый файл, загрузите такой инструмент, как WinRAR или 7Zip — эти программы добавят возможность сжимать или архивировать папку всякий раз, когда вы щелкаете ее правой кнопкой мыши. Затем сжатая папка будет создана в той же папке, из которой исходный файл.

      Вы также можете создать сжатый файл, используя контекстное меню правой кнопки мыши, встроенное непосредственно в Windows. Все, что вам нужно сделать, это выбрать файл, файлы или папку, которые вы хотите преобразовать в сжатый файл, а затем щелкнуть правой кнопкой мыши выбранный элемент или элементы. Затем выберите «Отправить», а затем «Сжатая (заархивированная) папка». Этот сжатый файл появится в папке, где находились выбранные файлы.

      Всякий раз, когда вы просматриваете Интернет, вы можете загрузить, скажем, фотоальбом или архив веб-сайта. Большинство подобных файлов, которые вы загружаете, сжаты, и чтобы получить к ним доступ, вам нужно определить суффикс файла, прежде чем предпринимать какие-либо действия.

      Читайте также:

Если вы используете WinZip 21 или более позднюю версию с файлами MP3, вы можете использовать лучший метод и сжать Файлы MP3 до 20% больше без потери качества. Если вы используете WinZip 12 или более позднюю версию с файлами JPG, вы можете использовать лучший метод и сжимать файлы JPG до 20% больше без потери качества. С этой настройкой WinZip будет использовать сжатие MP3 и/или Jpeg для файлов этих типов, и в результате получится файл Zipx. Если вы планируете поделиться этими Zip-файлами с другими, вы должны быть уверены, что они также используют WinZip 21 или более позднюю версию для распаковки файлов MP3 и WinZip 12 или более позднюю версию для распаковки файлов JPG.