Как сжать файл rtf

Обновлено: 25.06.2024

В своей первоначальной концепции формат .rtf представлял собой спецификацию форматирования текста и графики, предназначенную главным образом для облегчения взаимодействия документов и текста между приложениями обработки документов Microsoft. Это устранило необходимость в специализированном программном обеспечении для перевода, необходимом для открытия документов в различных версиях MS-DOS, Windows и Macintosh. Спецификация представляет собой проприетарный формат имени файла, впервые разработанный Microsoft в 1987 году для поддержки в Microsoft Word 3.0 и всех его версиях Microsoft Office Word. Последняя редакция, версия 1.9.1, была выпущена в 2008 году и также положила конец любым дальнейшим усовершенствованиям спецификации Microsoft. С помощью неформатированного текста, управляющих слов, управляющих символов и групп фрагмент текста может быть закодирован в формате .rtf. Затем все программы чтения RTF обрабатывают форматы .rtf, отделяя управляющую информацию и воздействуя на нее отдельно от фактического текста в документе. Хотя спецификация RTF является собственностью Microsoft, некоторые программы, не принадлежащие Microsoft, поддерживают как чтение документов .rtf, так и создание .rtf. Однако Microsoft Office Suite по-прежнему является наиболее популярным приложением, связанным с этой спецификацией.

Открытый XML-документ Microsoft Word

Стремясь создать стандарт открытого документа, Microsoft в сотрудничестве с ISO/IEC и Ecma разработала стандарт Office Open XML в 2006 году. Одним из расширений имен файлов, поддерживаемых в этой спецификации, является расширение .docx, обозначающее текстовый документ. расширение имени файла. Файл .docx был представлен в Microsoft Office Word 2007 и с тех пор поддерживается в более поздних версиях. Оно стало расширением имени файла по умолчанию для всех текстовых документов, созданных с помощью Microsoft Office Word. Учитывая природу спецификации XML с открытым исходным кодом, более альтернативные приложения для обработки документов поддерживают возможности чтения и записи документов, сохраненных с расширением имени файла .docx. Это по сравнению с расширением имени файла .doc, которое является проприетарным активом, принадлежащим Microsoft.

Встроенное и высокопроизводительное сжатие RTF-документов ZIP, TAR, GZIP, BZ2 и распаковка архива с использованием библиотеки zip-архивов на стороне сервера.

Обзор

Загрузить с NuGet

Откройте диспетчер пакетов NuGet, найдите и установите.
Вы также можете использовать следующую команду из консоли диспетчера пакетов.

Команда

Разработчики могут легко архивировать папки, отдельные или несколько файлов программно, написав всего несколько строк кода.

  • Определить путь к папке, содержащей файлы RTF.
  • Создать объект архива.
  • Используя объект Archive, загрузите файл с полным путем, используя его метод CreateEntry.
  • Вызовите метод Save() и передайте имя сжатого файла (полный путь) в качестве параметра.
  • Теперь вы получите файл RTF в виде zip-файла в соответствующей папке без использования zip, rar или любой другой совместимой программы.

Системные требования

Наши API поддерживаются на всех основных платформах и операционных системах. Перед выполнением приведенного ниже кода убедитесь, что в вашей системе выполнены следующие предварительные условия.

Онлайн-демонстрации сжатия RTF

Сжимайте документы в формате RTF прямо сейчас, посетив наш веб-сайт Live Demos. Демо-версия имеет следующие преимущества

RTF Что такое формат файла RTF

Представленный и задокументированный Microsoft формат Rich Text Format (RTF) представляет собой метод кодирования форматированного текста и графики для использования в приложениях. Этот формат облегчает межплатформенный обмен документами с другими продуктами Microsoft, что служит цели функциональной совместимости. Эта возможность делает его стандартом передачи данных между программным обеспечением для обработки текстов, и, следовательно, содержимое может быть передано из одной операционной системы в другую без потери форматирования документа. Спецификации форматов файлов доступны Microsoft для общедоступной загрузки, и на них может ссылаться разработчик.

Другие поддерживаемые форматы сжатия/распаковки

Поскольку расширенный текстовый формат (RFT) — это стандарт, который читается почти всеми текстовыми процессорами, такими как Word, WordPerfect и Wordpad, он является популярным способом хранения документов без изменений их форматов. Это может привести к тому, что файлы будут слишком большими для удобного хранения или быстрой передачи по электронной почте. Несколько вариантов могут сжимать файлы RTF в более управляемые архивы.

Онлайн

Шаг 1

Поиск онлайн-утилиты сжатия, такой как NippyZip, которая позволяет избежать загрузки программы, которая занимает место на жестком диске и может содержать вредоносное ПО. Вы ограничены максимальным размером файла 5 КБ, но можете одновременно сжимать до десяти файлов в формате zip. Вы также можете отправить ZIP-файлы на адрес электронной почты для последующего поиска или загрузить их прямо с сайта. Проверочный номер предотвращает захват сайта автоботами.

Шаг 2

Загрузите, установите и запустите бесплатную утилиту сжатия, такую ​​как 7-Zip, которая может сжимать RTF в форматы ZIP, GZIP, BZIP2 и TAR. Также доступен проприетарный формат 7Z, который обеспечивает степень сжатия до десяти процентов лучше, чем ZIP, и может создавать самораспаковывающиеся архивы. Поскольку программное обеспечение имеет открытый исходный код, разработчики могут изменять код в соответствии со своими потребностями. Защитное шифрование доступно для форматов 7Z и ZIP, а встроенный файловый менеджер упрощает организацию нескольких файлов. Хотя вы можете использовать эту утилиту через интерактивное окно, версия командной строки позволяет использовать более сложные комбинации параметров.

Шаг 3

Купите, установите и запустите коммерческую программу сжатия, например WinZip, которая позиционирует себя как «самую популярную в мире утилиту для сжатия файлов». Последняя версия имеет ленточный интерфейс Microsoft 2010 со всеми параметрами на вкладках. Утилита сжимает файлы в самораспаковывающиеся ZIP, LHA и проприетарные файлы ZIPX, что позволяет создавать самые маленькие архивы. Архивы могут идти прямо на CD и DVD. Вы можете определить собственную политику паролей для шифрования конфиденциальных файлов и автоматического удаления зашифрованных файлов после просмотра. Вы также можете отправить ZIP-файл по электронной почте из программы.

У нас есть код, который создает документ RTF из шаблона RTF. В основном это поиск строк и замена специальных тегов в файле RTF. Это доступно через веб-страницу.

Обычно время обработки для этого очень быстро.

Однако нам нужно встроить изображение в шаблон. Мы встроили их в виде изображений JPEG, используя функцию Word «Вставить/Изображение/Из файла». Но мы обнаружили, что результирующий размер файла RTF сильно зависит от изображения.

Например, я вставил логотип JPEG размером 20 КБ (по сути, это сплошной фон с текстом). Размер RTF-файла увеличился примерно с 390 КБ (без изображения) до 510 КБ (с изображением).

Затем мы вставили JPEG со скриншотом, т.е. изображение содержит текст, несколько цветов и т. д. Размер JPEG составляет около 150 КБ. С помощью этого изображения размер RTF-файла увеличился с 390 КБ до 3,5 МБ.

Поэтому кодировка, которую Word использует для хранения изображений в формате RTF, работает нелинейно. Я предполагаю, что это зависит от того, что находится в изображении JPEG.

Мне нужно свести размер RTF-шаблонов к минимуму, чтобы минимизировать время обработки файлов.

  • Есть ли у кого-нибудь идеи о том, как минимизировать размер файлов RTF со встроенными изображениями?
  • Есть ли способ управлять кодировкой, которую использует Word? Я нигде не вижу вариантов.
  • Кто-нибудь знает, какой тип двоичного кодирования использует Word/RTF?

Заранее спасибо.

Не то чтобы у меня был ответ, но почти наверняка, потому что он встраивается как несжатое растровое изображение, а не как сжатое представление, такое как JPEG.

6 ответов 6

Вот лучшее решение

СИМПТОМЫ

При сохранении документа Microsoft Word, содержащего графику EMF, PNG, GIF или JPEG, в файле другого формата (например, Word 6.0/95 ( .doc) или Rich Text Format (.rtf)), размер файла документа может значительно увеличиться.

Например, документ Microsoft Word 2000, содержащий сохраненную графику JPEG поскольку документ Word 2000 может иметь размер файла 45 568 байт (44,5 КБ). Однако при сохранении этого файла в формате Word 6.0/95 (.doc) или в формате Rich Text Format (.rtf) размер файла может увеличиться до 1 289 728 байт (1,22 МБ).

ПРИЧИНА

Эта функция реализована в Microsoft Word. Если изображение в формате EMF, PNG, GIF или JPEG вставлено в документ Word, при сохранении документа в нем сохраняются две копии изображения. Графика сохраняется в соответствующем формате EMF, PNG, GIF или JPEG, а также преобразуется в формат WMF (метафайл Windows).

РЕШЕНИЕ

Предупреждение. Если вы неправильно используете редактор реестра, вы можете вызвать серьезные проблемы, которые могут потребовать переустановки операционной системы. Microsoft не может гарантировать, что вы сможете решить проблемы, возникающие в результате неправильного использования редактора реестра. Используйте редактор реестра на свой страх и риск.

Чтобы Word не сохранял две копии рисунка в документе и чтобы уменьшить размер файла документа, добавьте строковое значение ExportPictureWithMetafile=0 в Microsoft Windows реестр.

Указывает алгоритм сжатия Rich Text Format (RTF), который сжимает и распаковывает данные RTF в один из поддерживаемых форматов сжатия или обратно.

Эта страница и связанный с ней контент могут часто обновляться. Мы рекомендуем вам подписаться на RSS-канал, чтобы получать уведомления об обновлениях.

Опубликованная версия

Предыдущие версии

Предварительные версии

Время от времени корпорация Майкрософт может публиковать предварительную или предварительную версию технического документа с открытыми спецификациями для рассмотрения и отзывов сообществом. Чтобы отправить отзыв о предварительной версии технического документа, следуйте инструкциям, указанным для этого документа. Если для документа не указаны инструкции, отправьте отзыв на форумах открытых спецификаций .

Период предварительного просмотра технического документа варьируется. Кроме того, не каждый технический документ будет опубликован для предварительного просмотра.

Предварительная версия этого документа может быть доступна на странице «Документы по протоколу Exchange Server — Документы для предварительного просмотра». После периода предварительного просмотра самая последняя версия документа доступна на этой странице.

Ресурсы для разработчиков

Найдите ресурсы для создания интероперабельных решений для программного обеспечения, служб, оборудования и продуктов сторонних производителей Microsoft:

Уведомление о правах на интеллектуальную собственность для документации с открытыми спецификациями

Техническая документация. Microsoft публикует документацию по открытым спецификациям («эта документация») для протоколов, форматов файлов, переносимости данных, компьютерных языков и поддержки стандартов. Кроме того, обзорные документы охватывают межпротокольные отношения и взаимодействия.

Авторские права. Эта документация защищена авторскими правами Microsoft. Независимо от любых других условий, содержащихся в условиях использования веб-сайта Microsoft, на котором размещена эта документация, вы можете делать ее копии для разработки реализаций технологий, описанных в этой документации, и можете распространять ее части в своих реализации, использующие эти технологии, или в вашей документации, необходимые для надлежащего документирования реализации. Вы также можете распространять в своей реализации с изменениями или без них любые схемы, IDL или примеры кода, включенные в документацию. Это разрешение также распространяется на любые документы, на которые есть ссылки в документации по открытым спецификациям.

Никаких коммерческих секретов. Microsoft не претендует на какие-либо права на коммерческую тайну в отношении этой документации.

Лицензионные программы. Чтобы просмотреть все протоколы, подпадающие под действие конкретной лицензионной программы, и связанных с ними патентов, посетите карту патентов .

Вымышленные имена. Примеры компаний, организаций, продуктов, доменных имен, адресов электронной почты, логотипов, людей, мест и событий, описанные в этой документации, являются вымышленными. Никакая связь с какой-либо реальной компанией, организацией, продуктом, доменным именем, адресом электронной почты, логотипом, лицом, местом или событием не предназначена и не должна подразумеваться.

Сохранение прав. Все другие права защищены, и это уведомление не предоставляет никаких прав, кроме тех, которые конкретно описаны выше, будь то косвенно, путем лишения права возражения или иным образом.

Инструменты. Документация по открытым спецификациям не требует использования инструментов программирования Microsoft или сред программирования для разработки реализации. Если у вас есть доступ к инструментам и средам программирования Microsoft, вы можете воспользоваться ими. Некоторые документы открытых спецификаций предназначены для использования в сочетании с общедоступными спецификациями стандартов и искусством сетевого программирования и, как таковые, предполагают, что читатель либо знаком с вышеупомянутым материалом, либо имеет к нему непосредственный доступ.

Читайте также: