Как выделить текст в файле djvu

Обновлено: 02.07.2024

ПОСЛЕДНЯЯ - Если у вас возникли проблемы с регистрацией в последнее время, попробуйте еще раз, теперь мы нашли и устранили проблему.

Как вручную добавить цветной текст в файлы DJVU

Поделитесь своим рабочим процессом программного обеспечения. Напишите свои советы и рекомендации по сканированию, оцифровке, распознаванию текста и переплету электронных книг.

mhr Сообщений: 37 Присоединился: 07 мая 2012, 10:12 Владелец электронных книг: onyx-boox-m92 sony-trs-t1 Количество книг в собственности: 500 Страна: Германия

Как вручную добавить цветной текст в файлы DJVU

Если вы хотите раскрасить черно-белый текст документа DJVU и
готовы сделать это вручную, вы можете сделать это, как описано в следующем обсуждении.

mhr Сообщений: 37 Присоединился: 07 мая 2012, 10:12 Владелец электронных книг: onyx-boox-m92 sony-trs-t1 Количество книг в собственности: 500 Страна: Германия

mhr Сообщений: 37 Присоединился: 07 мая 2012, 10:12 Владелец электронных книг: onyx-boox-m92 sony-trs-t1 Количество книг в собственности: 500 Страна: Германия

Теперь есть несколько подходов к этой задаче с использованием фотокодера c44 цепочки инструментов djvulibre.
Это часто выглядит немного нечетко и немного увеличивает размер файла. Но утилита djvumake из djvulibre имеет
причудливую возможность указать список цветных прямоугольников, который используется для создания слоя FGbz, содержащего информацию о цвете каждого закодированного символа.
Утилита ppmrectlist извлекает цветные прямоугольные области из файла PPM и создает на выходе такой список в формате, который ожидает djvumake.
Сейчас я приведу небольшой пример.

mhr Сообщений: 37 Присоединился: 07 мая 2012, 10:12 Владелец электронных книг: onyx-boox-m92 sony-trs-t1 Количество книг в собственности: 500 Страна: Германия

  • Измените режим изображения на RGB.
  • Поменять местами черный/белый с инверсией цвета.
  • Сделайте этот текстовый слой прозрачным.
  • Удалите теперь белую нетекстовую область.
  • Добавьте новый непрозрачный слой, заполненный черным цветом, ниже этого текстового слоя и выберите его для редактирования.

Теперь удалите текстовый слой (или сделайте его невидимым). Затем сохраните изображение в файл PPM, например. пример_рект.ppm.
Это должно выглядеть так:

Сохраненное изображение PPM с прямоугольной информацией о цвете, файл example_rect.ppm example_rect.jpg (4,06 КиБ) Просмотрено 12031 раз

Это создаст необходимую нам информацию о цвете прямоугольника. Содержимое файла example_rect.txt
выглядит как

Если вы используете Windows, вам необходимо указать содержимое файла example_rect.txt вместо последних кавычек.
Или вы используете cygwin с оболочкой unix. Кавычки будут выполнять системную команду cat, которая отображает
содержимое файла как тип в окнах и объединяет результат в виде текста в команде djvumake.

Теперь DJVU-файл example.djvu должен содержать наш конечный результат и должен выглядеть как

Размер файла этого (нелепого) примера example_bw.djvu составляет 458 байт. Размер файла с расширенным цветом
example.djvu составляет 520 байт. Для более реалистичных размеров файлов увеличение размера файла остается незначительным.
Обратите внимание, что из-за реализации djvumake каждый прямоугольник изображения увеличивает конечный размер файла на три байта
(запись цветовой палитры RGB в фрагменте FGbz). Другое увеличение размера файла связано со сжатой (с помощью BZZ) индексной таблицей с
16-битными записями в приведенной выше цветовой палитре для каждого закодированного текстового символа.

Обратите внимание, что для получения соответствующего цвета не обязательно, чтобы текстовый символ полностью помещался в прямоугольник. Но если есть
несвязанные части (например, точка в букве "i" в нашем примере), все их ограничивающие рамки должны пересекать соответствующий прямоугольник.
Если ограничивающую рамку буквы пересекают несколько прямоугольников, выигрывает последний прямоугольник.

mhr Сообщений: 37 Присоединился: 07 мая 2012, 10:12 Владелец электронных книг: onyx-boox-m92 sony-trs-t1 Количество книг в собственности: 500 Страна: Германия

Я просто хочу упомянуть еще один трюк, который работает с инструментами cjb2, cpaldjvu и minidjvu.
Если у Вас цветной текст (мало цветов, без прямоугольников, как и финальная картинка последнего поста), то Вы можете закодировать его с помощью cpaldjvu:

Вы также кодируете чистый черно-белый текст с помощью хорошего компрессора, такого как minidjvu, в многостраничной настройке:

Обратите внимание, что параметр -l или --lossy вызывает параметр --clean, а последний параметр удаляет
небольшие связанные компоненты, что, в свою очередь, изменяет порядок связанных компонентов. Но это губительно для
этого подхода. Это означает, что перед использованием cpaldjvu и minidjvu необходимо выполнить удаление пятен!

Теперь вы дополняете образец страницы старым фрагментом FGbz:

но без результата_dummy.djvu.

Этот трюк, кажется, работает для меня. Он основан на предположении, что порядок закодированных символов
cpaldjvu и других инструментов, таких как minidjvu или cjb2, всегда идентичен.
Я не знаю, всегда ли верно это предположение. Это может быть так, если все эти инструменты используют одну и ту же библиотечную функцию для получения
всех подключенных компонентов и сохранят этот порядок. В моих (до сих пор очень ограниченных) тестах я преуспел.

Вышеприведенное предположение, безусловно, нарушается, если связанный компонент должен быть окрашен двумя или более цветами. Поэтому логотипы и т. д. будут проблемой!

Вообще не забывайте всегда проверять правильность полученного файла DJVU!!

3 ответа. можно использовать для просмотра, выделения и комментирования (с заметками) файлов pdf и djvu. После открытия документа в Okular нажмите F6 (или клавишу Fn + F6). Появятся элементы управления для выделения и комментирования (вместе с некоторыми другими инструментами).

Является ли файл DjVu безопасным?

Да, файл DjVu может быть опасен. Хотя, как уже упоминалось, он разработан так, чтобы не иметь исполняемого кода, уязвимость в синтаксическом анализаторе DjVu может быть использована для использования средства просмотра. Многие средства просмотра используют одну и ту же библиотеку, что делает уязвимость в одной библиотеке актуальной для большого числа средств просмотра.

Как использовать файлы DjVu?

  1. Нажмите кнопку «Открыть», чтобы найти файл DjVu, который нужно открыть на вашем ПК в проводнике Windows.
  2. Ваш файл DjVu открыт в DjVuLibre DjView.
  3. Чтобы открыть файл DjVu в WinDjView, перетащите файл в окно программы или нажмите кнопку «Открыть», чтобы найти файл с помощью проводника Windows.

Почему используется DjVu?

DjVu позволяет распространять в Интернете изображения отсканированных документов, цифровых документов и фотографий очень высокого разрешения. DjVu позволяет разработчикам контента сканировать цветные страницы книг, журналов, каталогов, руководств, газет, исторических или древних документов с высоким разрешением и размещать их в Интернете.

Могут ли файлы DjVu содержать вирусы?

Вирус с расширением файла DJVU (.djvu) — это новый класс программ-вымогателей, которые атакуют ваш компьютер и шифруют важные файлы в вашей системе. Вирус меняет расширения всех основных файлов (DOC, TXT, PDF, XLS, JPG, PPT, MP4, MP3 и т. д.) на зашифрованные .

Как выделить текст в Zathura?

<р>нет. самое быстрое — это двойной щелчок в правом нижнем углу и небольшое перетаскивание, чтобы выбрать всю страницу (двойной щелчок начинает выделение с верхнего левого угла туда, где находится курсор), но это не выделяет последнюю одну или две строки. даже если вы выбрали всю страницу.

Как удалить вредоносные расширения?

1.1 Простое удаление djvu

  1. На рабочем столе компьютера нажмите кнопку "Пуск".
  2. Выбрать все приложения.
  3. Найдите файл с расширением djvu (и другие связанные программы).
  4. Нажмите на него правой кнопкой мыши и выберите "Удалить".

Может ли DJVU содержать вирус?

Djvu – это вирус высокого риска, принадлежащий к семейству вредоносных программ STOP. Впервые он был обнаружен Майклом Гиллеспи. Он относится к категории программ-вымогателей и предназначен для блокировки (шифрования) файлов с использованием криптографического алгоритма.

Как открыть файл DJVU в браузере?

Перейдите в chrome://apps/ и откройте приложение DjVu Viewer and Reader. На вкладке расширения либо перетащите файл DjVu, либо нажмите «Выбрать файл» и выберите целевой файл во всплывающем диалоговом окне.

Как открыть DIVU?

Чтобы открыть документ DjVu с помощью веб-браузера, выполните одно из следующих действий:

  1. Перетащите документ DjVu из файловой системы в окно веб-браузера.
  2. Перетащите вложенный документ DjVu из приложения электронной почты в окно веб-браузера.
  3. В меню "Файл" выберите "Открыть".

Какое приложение открывает файлы DJVU?

Ebookdroid — программа для чтения документов для Android Также существует множество бесплатных программ для чтения документов, которые позволяют открывать DjVus на Android. Хороший, например, Ebookdroid, который также поддерживает PDF.

Как открыть DjVu в Windows 10?

Шаг 1. Нажмите кнопку «Открыть», чтобы найти файл DjVu, который нужно открыть на вашем ПК в проводнике Windows. Кроме того, вы можете просто перетащить файл в окно этого DjVu-ридера.

Как открыть файлы DjVu?

Шаг 1. Чтобы открыть файл DjVu в WinDjView, перетащите файл в окно программы или нажмите кнопку «Открыть», чтобы найти файл с помощью проводника Windows. Шаг 2. Файл успешно открыт в WinDjView.

Что открывает файлы DjVu?

Файлы DjVu представляют собой тип файла документа, аналогичный PDF. Для их открытия требуется специальное программное обеспечение. Один из способов открыть эти файлы — использовать плагин для вашего веб-браузера. Этот подключаемый модуль позволит вам открывать файлы DjVu в окне браузера.

Какая лучшая программа для чтения DjVu?

АльфаЧитатель. AlfaReader — легкая и быстрая программа для чтения электронных книг. Идеально подходит для чтения электронных журналов, учебников для учащихся, медицинских, научных, технических книг, иллюстрированных книг для детей.

Моя работа включает в себя множество книг, которые нужно прочитать. Следовательно, во время чтения мне нужно --прокомментировать и выделить символы в виде файла PDF и DJVU.

Я установил Document Viewer и qpdfviewer. Но в обоих этих программах такой возможности нет.

Я не могу найти другое средство обновления программного обеспечения Ubuntu. Поэтому, пожалуйста, предложите мне программное обеспечение в соответствии с моими потребностями.

2 ответа 2

Вы можете использовать Xournal — приложения Ubuntu

Xournal – это приложение GTK+ для создания заметок, зарисовок и ведения журнала с помощью стилуса. Его также можно использовать для добавления аннотаций к файлам PDF.

Xournal

Необязательно, чтобы удалить Xournal, запустите:

DjVuLibre, которая является реализацией DjVu, включая средства просмотра, плагины для браузера, декодеры, простые кодировщики и утилиты.

DjVuLibre

Okular – это универсальное средство просмотра документов с поддержкой расширенных функций документов, таких как выделение, аннотации, формы и встроенные файлы.

Okular

Чтобы просмотреть файлы djvu с помощью Okular:

okular сохраняет аннотации djvu внутри, а это означает, что если я открою аннотированный djvu в других средствах просмотра, кроме okular, я не увижу аннотации.

Да, вы можете комментировать в средстве просмотра документов (или evince), но я не нашел записей для выделения. Вот как добавить комментарий в средстве просмотра документов (или аннотацию):

В средстве просмотра документов у вас может быть боковая панель, или вы можете открыть ее вручную, нажав F9

В верхней части боковой панели есть несколько параметров, например:

Верх боковой панели

Затем вы можете выбрать параметр Аннотации, как показано на рисунке. Затем нажмите кнопку Добавить.

введите здесь описание изображения

Нажмите кнопку "Перо", чтобы добавить его.

Pen

Появится маленький белый крестик. Нажмите в любом месте документа, чтобы начать комментарий, или добавьте аннотацию.

Чтобы использовать функцию выделения, вам нужно спросить других людей.

Что касается файлов djvu, мне нравится читать их в djview, потому что, когда я ищу некоторые слова, он может сразу показать, где находятся все результаты, и выделить их одновременно. Это намного удобнее, чем поиск pdf-файлов в evince.

Для pdf-файлов мне нравится использовать Xournal, чтобы аннотировать его, например, подчеркивать некоторые строки, добавлять текстовые комментарии.

Но для одного файла (pdf или djvu) мне нужно создать два файла (один в pdf, а другой в djvu) и открыть их в djview и xournal (а может быть и в evince), чтобы добиться два преимущества, которые я описал выше.

Я еще не пробовал многие другие функции djview, xournal и evince, а также многие приложения. Есть ли у вас какие-то удобные способы добиться того, что я надеюсь сделать, и, возможно, большего, о чем я еще не упомянул?

Моя ОС — Ubuntu 12.04.

evince также может отображать файлы .djvu, но не может выполнять поиск по слою ocr-текста, если он доступен. Возможно, вы сможете найти расширения для evince или производные от evince, которые делают то, что вам нужно.

5 ответов 5

Я рекомендую редактор PDF-Xchange (устанавливается в Linux через Wine). Он работает как хороший просмотрщик, позволяя открывать несколько файлов во вкладках. Пользовательский интерфейс фантастический. И самое главное, он хранит аннотации/комментарии внутри файла, в отличие от Okular. Как установить?

а затем, чтобы открывать pdf-файлы с помощью PDF-Xchange непосредственно из файлового менеджера, используйте этот скрипт

Спасибо. Хорошо ли работает pdf-xchange на Arch? Мой, установленный через Wine на Ubuntu, часто падает посередине, особенно когда я пытаюсь сохранить аннотации в pdf.

Небольшое исправление: okular хранит аннотации и выделения внутри документа PDF несколько лет назад. Я использовал его для изучения некоторых PDF-файлов, чередуя его со средством просмотра документов в OSX, и оба распознавали основные моменты друг друга.

Попробуйте Okular. Его можно использовать для комментирования файлов PDF и DjVu.

@Anthon Это запись в блоге Эшвина, и у меня мало времени. Но вы правы, просто размещать ссылку - дурной тон. Мой плохой.

Хотя это не самый простой способ начать работу (но все же довольно простой), если вам действительно нравятся мощные аннотации, попробуйте Emacs (или Spacemacs) с инструментами для работы с файлами PDF. Он обеспечивает zathura как опыт чтения (хотя и гораздо более мощный), но с очень хорошими функциями аннотаций (еще более мощные функции аннотаций через pymupdf-режим). Также он предоставляет функции чтения djvu и аннотации djvu через djvu.el (или экспериментальный djvu2.el). Кроме того, он предоставляет org-mode, очень мощную библиотеку для создания заметок, которая может быть полностью интегрирована с ведением заметок в формате pdf и djvu (например, через org-noter).

Начиная с ванильного Emacs, у вас может пройти около часа, прежде чем вы настроите все для аннотирования. Однако, начиная с Spacemacs, вы можете начать комментировать в течение 10 минут, просто установив Emacs, Spacemacs и слой pdf.

Spacemacs предоставляет зло, реализацию редактора Vim, с платформой программирования Emacs, чтобы обеспечить очень хорошо интегрированные всесторонние вычислительные возможности (это звучит немного расплывчато, но суммирование того, что Emacs может здесь сделать, заняло бы слишком много места. Вы увидите его, когда вы начнете его использовать). Но вы можете просто использовать его как zathura как читатель с функциями аннотаций (что-то вроде mupdf-gl, но менее громоздко).


Выделенные аннотации обычно уже давно доступны в предварительной версии. Теперь добавлены как текстовый комментарий, так и произвольный текст (среди прочего).

Текущие ежедневные/предварительные сборки позволяют комментировать PDF (только).

image

Предыдущие эксперименты по выделению других форматов файлов в FixedPageUI (только) с использованием .smx больше не используются.

Чтобы выделить текст, который можно выделить, просто выберите его, проведя левой кнопкой вниз, затем, как и раньше, нажмите A (или используйте контекстное меню, чтобы создать аннотацию > выделить)

ПРИМЕЧАНИЯ
в настоящее время выделяет НЕ МОЖЕТ БЫТЬ ПЕРЕМЕЩЕН необходимо заменить (и удалить оригинал). Цвет и другие проявления могут быть изменены.
Такие объекты, как вставки, комментарии, штампы и т. д., можно перемещать путем перетаскивания.
Свободный текст в настоящее время не имеет свободной формы для изменения размера, поэтому пока просто установите границу на 0

Помните, что для PDF-файлов размером до 32 МБ вы можете одновременно редактировать один и тот же файл/страницу как в Edge, так и в SumatraPDF.
После изменения в SumatraPDF вам нужно сохранить аннотацию, а в Edge вам ТАКЖЕ нужно будет нажать перезагрузку/обновить. Однако, когда вы СОХРАНЯЕТЕ изменения файла, например. после рукописного ввода в Edge нет необходимости нажимать кнопку «Обновить», в SumatraPDF он появится мгновенно.

изображение


Включает ли последняя версия Sumatra выделение основных моментов, кроме поиска и закладок? Я пока не нашел пути. Если да, то может ли кто-нибудь сказать мне, как это сделать или где это найти?

Заранее спасибо


@Alonso: вам нужно будет использовать одну из ежедневных или предварительных версий, как указано выше.


Понятно, большое спасибо!


есть ли возможность выделить/аннотировать файл mobi/epub?

даже с использованием предварительной версии ? у меня не было возможности сделать это.


Это БЫЛО возможно в прошлых предварительных выпусках (и было применимо/полезно для txt chm и mobi/epub/ebooks в фиксированном интерфейсе), и какое-то время существовало две системы, поэтому полная версия 3.2 все еще может работать с этими .smx. файлы, таким образом можно вручную (текстовая программа) написать свой собственный.

Однако этот исторический метод был удален после версии 3.3.13011, поскольку новые методы аннотирования PDF все больше противоречили друг другу.
Возможно найти более ранние предварительные версии с возможностью добавления выделения в mobi / epub, но удаление было общеизвестно глючным, поэтому часто для внесения изменений приходилось прибегать к корректировке значений в текстовом редакторе.

Если вы хотите посмотреть, как это работает, и иметь версию 3.2 (подойдет портативная версия), переименуйте любой файл epub в Any.epub
Сохраните следующий текст в той же папке, что и Any.epub.smx (это то же самое имя файла с .smx, что примерно = SumatrapdfMetaXtension)

Откройте Any.epub и УБЕДИТЕСЬ, что вы видите окно поиска «Найти:» (должен быть установлен флажок «Отладка» > «Переключить интерфейс электронной книги»), посмотрите результат цветных блоков ниже (они всегда были бледнее в файлах, отличных от pdf, даже когда непрозрачность = 1,0 ), теперь поиграйте со значениями в Блокноте, чтобы выровнять текст (СОВЕТ: используйте SumatraPDF M для инструмента измерения). Не самый простой способ работы, но я иногда буду использовать его для длинных текстовых файлов, поскольку ни одно другое приложение, насколько мне известно, не может сделать это с обычным текстом.

image

ПРИМЕЧАНИЕ: размещение в epub (и других файлах зависит от масштаба), поэтому при использовании инструмента измерения в пунктах расчетное положение необходимо умножить на 96/72 = 1,333

Здесь я изменяю измеренное значение для второго блика, чтобы оно соответствовало
верхнему левому углу в пунктах 95,0 x 73,6 и ширине = 178,8 x 32,6, поэтому я добавил к smx как 126 96 240 50 (округлено для удобства)< /p>

image

Запуск может показаться медленным, но вы найдете ярлыки, такие как угадать приблизительное положение, сохранить в блокноте с помощью Ctrl S, затем перефокусировать SumatraPDF и нажать R, чтобы перезагрузить это редактирование, а затем перейти к следующему, эти десятичные знаки не нужны, поэтому
rect = 126 96 240 50
должно работать так же хорошо

Еще одна уловка, чтобы уменьшить умственную арифметику, состоит в том, чтобы работать в дюймах и игнорировать десятичные дроби, поскольку 1,00 дюйма, рассматриваемый как 100, близок к необходимому значению 96 dpi.
Поэтому для положения верхнего блика на экране я могу мысленно округлить вниз несколько процентов

так что здесь, измеряя в дюймах, мне нужно сказать, что 200 45 80 40 меньше, чем 215 049 083 041

image

Возможно, я был немного агрессивен при округлении в меньшую сторону, но результат достаточно хорош

image

Этот файл не редактирует электронную книгу, поскольку он просто добавляет сопутствующий файл, а для добавления заметок/комментариев на страницу в отдельный сопутствующий файл у меня есть другие способы сделать это на форуме (проще всего с помощью MS write/WordPad)


sumatra — отличная программа для просмотра pdf, не очень, но в ней нужна правильная функция аннотации. Пожалуйста, включите его, братья-разработчики


Было бы здорово, если бы вы добавили

> удалить выбранную аннотацию

в контекстном меню правой кнопки мыши. Это было бы полезно и сэкономило бы много времени, вместо того, чтобы обращаться к диспетчеру аннотаций, мы напрямую удаляем аннотации облаком.
Спасибо.


Это клавиша DEL (а также ее можно выбрать в контекстном меню)

Я просто нажал клавишу del на одном выделении, и оно исчезло (обратите внимание, что оно, возможно, не было удалено, а только теперь отсутствует в списке, что является «особенностью» поэтапного написания аннотаций)

ПРИМЕЧАНИЕ: файл со «скрытым» выделенным цветом по-прежнему будет запрашивать сохранение исходного выделенного фрагмента КАК его теперь невидимый вариант, поэтому он все равно будет увеличиваться на столько же в области аннотаций. Ясно, что это не ошибка, но мне решать, отменить ВСЕ изменения или оставить эти 2 восстанавливаемых изменения в дополнение ко всем остальным.

Читайте также: