Как удалить страницу в abbyy FineReader

Обновлено: 21.11.2024

ABBYY FineReader Sprint — это инструмент, который превращает любую бумажную копию в текстовый онлайн-текст, который можно редактировать на компьютере. С помощью программы вы можете исправлять изображения, переформатировать документ или даже редактировать набранный текст. В этом руководстве я познакомлю вас с ABBYY FineReader и его инструментами, чтобы вы могли сканировать и редактировать свой собственный документ.

Часть первая: начало работы

Размещение документа на сканере

Откройте сканер и поместите документ лицевой стороной вниз. Выровняйте документ по правому нижнему углу сканера, указанному стрелкой. Слегка приподнимите, чтобы закрыть экран сканера.

Начать новую задачу

После того как вы откроете ABBYY FineReader в приложениях, на вашем экране появится новая задача. Если вы сканируете документ, выберите EPSON DS-1630 (или другой сканер) в качестве источника. Если документ уже доступен на вашем компьютере, выберите это устройство в качестве источника. Затем выберите язык и формат преобразования вашего документа. Вы можете преобразовать документ в файл PDF, документ Word, электронную таблицу Excel или документ HTML, как показано ниже.

Импорт вашего документа

При выборе формата преобразования появится предварительный просмотр вашего документа. С правой стороны (изображенной ниже) вы можете настроить импорт документа с несколькими настройками, такими как режим, глубина цвета, разрешение и область сканирования. Вы также можете выбрать сканирование нескольких страниц без паузы или с определенным интервалом в секундах. После внесения всех изменений нажмите «Сканировать» в правом нижнем углу.

Завершить импорт и сохранить документ

После завершения сканирования нажмите «Завершить импорт» в правом нижнем углу. После этого компьютер предложит вам сохранить документ на компьютер.

Добавление дополнительных страниц

Если вы хотите добавить в документ больше страниц, щелкните раскрывающийся список в верхнем левом углу с надписью «Добавить страницы». Вы можете либо отсканировать другой документ, либо импортировать другой документ с вашего компьютера. Следуйте инструкциям, перечисленным в шагах 2 и 3, чтобы отсканировать и импортировать дополнительный документ. Вы можете изменить порядок документов в любой момент, щелкнув и перетащив их с левой стороны.

Часть вторая: редактирование документа

Редактирование изображений в документе

В правом верхнем углу вы найдете Редактор изображений, который адаптирует внешний вид документа и изображения на странице. Следующие инструменты предлагаются для помощи в редактировании изображения.

      • Выравнивание перекоса помогает устранить искажения изображения при сканировании толстой книги или обработке цифровых фотографий текста.
      • Фотокоррекция выпрямляет размытый текст, устраняет размытость изображения при движении и уменьшает шум ISO.
      • Поворот и отражение изображения, текста или страницы.
      • Разделить страницу на несколько страниц
      • Обрезать изображение, страницу или текст
      • Настройка разрешения изображения
      • Инвертировать цвета на фотографиях или в тексте
      • Настройка яркости и контрастности изображения
      • Удалить любые ошибки в документе

    Форматирование документа

    С левой стороны находится панель инструментов, с помощью которой можно редактировать макет и формат документа. Вы можете использовать инструменты для выделения абзацев текста или отдельных изображений и перемещения их в разные области документа. Кроме того, вы можете стереть целые области текста или изображений, которые хотите удалить.

    Этим сообщением мы завершаем обзор функций ABBYY FineReader PDF 15, которые помогают манипулировать PDF-документами и изменять их порядок.

    Улучшение внешнего вида страниц PDF

    Обрезка может улучшить внешний вид страниц в PDF-файлах, особенно отсканированных. Но как еще мы можем улучшить его с помощью FineReader PDF?

    Используя инструмент «Улучшить изображения страницы» в меню «Правка», вы можете попросить FineReader PDF:

    • Исправьте неправильную ориентацию страниц в документе PDF.
    • Исправьте перекос изображений на странице, чтобы строки текста были горизонтальными.
    • Если символы выглядят неровными из-за низкого разрешения сканирования или плохого качества самого исходного документа (например, скан копии факса), примените технологию PreciseScan, чтобы текст выглядел более плавным и четким.

    Инструмент улучшения изображения для улучшения визуального качества отсканированных PDF-файлов с возможностью поиска

    Совет. Для этих исправлений требуется помощь OCR, поэтому убедитесь, что языковые настройки OCR указаны правильно. Поскольку FineReader PDF может автоматически определять язык(и) документа, для подавляющего большинства документов лучше всего настроить список автовыбора языка один раз, а затем просто оставить настройку языков OCR в позиции автовыбора.

    Удаление страниц из документа PDF

    Удалить выбранные страницы из PDF-файла очень просто: либо нажмите «Удалить…» в контекстном меню, либо нажмите «Del» на клавиатуре с выбранной страницей, а затем подтвердите свое действие.

    Теперь мы рассмотрели все возможности FineReader PDF 15 для работы с PDF-документами и страницами. Однако в программе есть масса других полезных функций, о которых мы продолжим рассказывать в следующих постах — следите за обновлениями! Кроме того, посмотрите наши обучающие видеоролики на веб-сайте, чтобы увидеть другие функции в действии.

    Прочитайте другие статьи из этой серии о работе со страницами PDF с помощью ABBYY FineReader PDF 15:

    При работе с PDF-документами нам часто приходится манипулировать страницами: объединять два или несколько документов в один или, наоборот, разбивать длинный документ на несколько меньших частей, добавлять страницу или две из другого документа, удалять некоторые страницы, изменить порядок страниц и так далее. В этой учебной статье вы узнаете, как работать со страницами PDF в ABBYY FineReader PDF 15, какие есть инструменты и как их использовать. Эта информация будет полезна читателям, которые либо рассматривают FineReader PDF 15 как решение для работы с PDF и хотели бы узнать больше о его возможностях, либо хотят научиться более эффективно использовать FineReader PDF 15.

    1. Как объединить документы PDF в один

    Есть два способа начать процесс: либо выбрать PDF-файлы, которые нужно объединить, в проводнике Windows и выбрать «Объединить в один PDF…» в контекстном меню, либо запустить FineReader PDF, нажать «Преобразовать в PDF». и выберите PDF-файлы для объединения в диалоговом окне «Открыть».

    Чтобы объединить несколько PDF-файлов как есть, без каких-либо изменений и/или улучшений, выполните следующие действия:

    • Оставьте все настройки по умолчанию в открывшемся диалоговом окне «Преобразовать в PDF».
    • Проверьте и при необходимости измените порядок объединения PDF-файлов.
    • Убедитесь, что установлен параметр "Объединить все файлы в один документ".
    • Нажмите «Преобразовать в PDF».

    Диалоговое окно «Преобразовать в PDF»

    Дополнительные настройки можно выполнить в диалоговом окне «Преобразовать в PDF»:

    • Настройте качество изображения в объединенном PDF-файле. Чем лучше качество изображения, тем больше будет итоговый файл.
    • Укажите, будет ли результирующий документ доступен для поиска. Параметр «Как в исходном документе» позволяет сохранить части в том виде, в котором они были изначально: на страницах, доступных для поиска, по-прежнему будет разрешен полнотекстовый поиск, а на страницах, недоступных для поиска (например, в отсканированных PDF-файлах), останутся только изображения.
    • Выберите, если хотите, чтобы итоговый файл PDF соответствовал спецификации PDF/A для долгосрочного архивирования.
    • Уменьшите размер итогового файла PDF с помощью алгоритмов сжатия MRC. Для этого потребуется применить OCR ко всем страницам исходных PDF-файлов, поэтому обязательно проверьте, указаны ли языки документа в списке «Языки OCR» ниже.
    • Вы также можете получить доступ и настроить любые параметры обработки и сохранения, поддерживаемые FineReader PDF, с помощью диалоговых окон параметров, доступных в «Настройки предварительной обработки изображения…» (будут применяться к PDF-файлам на основе изображений) и «Дополнительные параметры…» ярлыки.

    2. Разделение PDF на части

    С помощью ABBYY FineReader PDF 15 вы можете разбивать PDF-документы на части:

    • Размер файла
    • Количество страниц
    • Закладки первого уровня

    Чтобы разделить PDF, используйте инструмент «Разделить документ» в FineReader PDF 15. Чтобы запустить его, откройте документ PDF и выберите «Файл» -> «Разделить документ…» в главном меню. Прочтите пошаговую инструкцию по использованию этого инструмента по этой ссылке, а также посмотрите короткое обучающее видео:

    В этой статье мы хотели бы дополнить уже имеющуюся информацию об этой функции некоторыми полезными советами и соображениями, которые вы, возможно, захотите принять во внимание при использовании инструмента «Разделить документ»:

    • При разделении по размеру файла убедитесь, что указанный вами размер меньше размера исходного документа.
    • Может случиться так, что некоторые части будут иметь больший размер, чем указанный, если исходный PDF содержит «тяжелое» содержимое (например, большое количество изображений, шрифтов, интерактивных форм и т. д.), а указанный файл предельный размер относительно невелик. В этом случае вы можете сначала попробовать уменьшить размер исходного PDF-файла, используя параметр «Уменьшить размер файла».
    • Если исходный PDF-файл содержит вложения, они будут сохранены как отдельные файлы в подпапке «Вложения» в той же папке, в которой вы выбрали сохранение результата.
    • Закладки теряются при разделении PDF-файла.
    • При разделении по закладкам и использовании меток закладок для имен результирующих PDF-файлов по умолчанию части также нумеруются в конце имен файлов. Поэтому будьте осторожны, если закладки в вашем PDF-файле заканчиваются цифрами. Чтобы два числа не «склеивались» между собой, можно либо вообще отключить нумерацию, либо изменить ее размещение на «Перед именем».
    • Если вы выберете вариант «Пользовательское имя» для именования частей, по умолчанию будет предложено имя исходного документа.
    • Если есть страницы с более чем одной закладкой первого уровня, FineReader PDF не сможет разбить страницу на несколько частей, и все закладки на таких страницах, кроме первой, будут проигнорированы, а части для них не будут создан.

    3. Добавление страниц в файл PDF

    В FineReader PDF вы можете добавлять новые страницы в существующий PDF-файл из другого PDF-файла, из изображения или редактируемого файла (например, DOCX, XLSX и т. д.) или сканировать их с бумажного документа на сканере.< /p>

    Есть три способа начать процесс:

    1. Кнопка «Добавить страницы» на главной панели инструментов.
    2. В главном меню «Правка».
    3. Из контекстного меню на странице в окне Pages
    4. Добавление страниц в PDF из другого PDF

      Команда «Добавить страницы из PDF…» подойдет вам, если вы не хотите, чтобы к добавляемым страницам применялась какая-либо обработка или улучшения. Однако если вы это сделаете, используйте команду «Добавить страницы из файла…» (описана далее), которая позволяет применять функции предварительной обработки изображения и улучшения PDF.

      Добавление страниц в PDF из файла

      Используйте команду «Добавить страницы из файла…», когда вам нужно добавить страницы из файла, отличного от PDF, в существующий PDF. С FineReader PDF нет необходимости предварительно конвертировать эти страницы в PDF — преобразование будет выполнено на лету.

      Другое использование этой команды — когда вы хотите добавить страницы из PDF-файла, и эти страницы необходимо улучшить. Например, вам нужна страница из отсканированного PDF-файла, которая перекошена и отсканирована слишком темным цветом, и вы хотите это исправить.

      Интерфейс и использование аналогичны команде «Добавить страницы из PDF…», описанной ранее, однако в команде «Добавить страницы из файла…» есть еще один элемент, который дает вам доступ ко всем этим параметрам предварительной обработки и исправления: « Кнопка «Настройки…», открывающая диалог «Настройки обработки изображений»:

      Диалоговое окно «Настройки обработки изображений»

      Там вы можете установить:

      • Настройки качества изображений. Один из вариантов — «Пользовательский…», который позволяет точно настроить разрешение, цвет и уровень качества.
      • «Распознавать текст на изображениях» — если установлено, FineReader будет превращать отсканированные страницы и другие изображения с текстом в доступный для поиска текст.
      • «Использовать сжатие MRC» может уменьшить размер результирующего файла PDF, в то же время сохранив максимально возможное визуальное качество документа за счет применения алгоритмов сжатия смешанного растрового содержимого (MRC).
      • При включенном сжатии MRC вы также можете включить технологию PreciseScan для улучшения визуального качества страниц, отсканированных с недостаточным разрешением или со слишком сильным сжатием. Он сглаживает и делает края символов более четкими, делая текст более четким и легко читаемым.
        Как сжатие MRC, так и PreciseScan требуют оптического распознавания текста, поэтому убедитесь, что настройки языка документа выполнены правильно.
      • При добавлении страниц из файлов изображений можно отдельно выбрать, какие из «Настройки предварительной обработки…» следует применить. Однако в большинстве случаев подойдут настройки по умолчанию:

      • Наконец, с помощью ярлыка «Дополнительные параметры…» вы можете получить доступ к любым настройкам обработки изображений, языка, оптического распознавания символов и PDF, поддерживаемым FineReader PDF, и настроить их для выполнения текущей задачи с наилучшим возможным результатом.< /li>

      Добавление страниц в PDF со сканера

      Прежде всего убедитесь, что ваш сканер включен и правильно подключен к компьютеру.

      • Откройте PDF-файл, в который вы хотите добавить страницы, и используйте команду «Добавить страницы со сканера…». Откроется диалоговое окно интерфейса сканирования.
      • Выберите устройство и задайте параметры сканирования. Подробную информацию о настройке сканирования для улучшения результатов преобразования вы можете найти в этой статье справочной системы FineReader PDF.
      • Нажмите кнопку «Просмотр», чтобы просмотреть изображение добавляемой страницы.
      • При необходимости укажите нужные параметры предварительной обработки изображения в диалоговом окне «Настройки…».
      • Отсканируйте страницу, которую нужно вставить в текущий документ PDF.

      Вы также можете создать пустую страницу в PDF-документе с помощью команды «Добавить пустую страницу», доступной как в меню «Правка» -> «Добавить страницы…», так и в контекстном меню на странице в Страницах. окно.

      Дополнительные инструкции!

      В части 2 этой статьи мы рассмотрим, как изменить порядок, заменить и удалить страницы в PDF-файле, создать новый PDF-файл из выбранных страниц и выполнить другие действия со страницами, такие как поворот, обрезка и улучшить их внешний вид. Оставайтесь с нами!

      1. Щелкните правой кнопкой мыши файл PDF с именем «InterAmerican.pdf», выберите «Открыть с помощью ABBYY FineReader 14».
      2. Нажмите раскрывающийся список «Распознать текст» и выберите «Открыть в редакторе OCR».
      3. Просмотр вывода OCR

        • После завершения процесса оптического распознавания символов мы можем сравнить исходный документ с текстовой версией.
        • ABBYY выделяет потенциальные ошибки синим цветом. Мы можем вручную исправить или отредактировать текстовые данные перед сохранением/экспортом для повышения качества.

        Потратьте несколько минут на исправление и проверку выделенного текста вручную.

        Улучшение качества оптического распознавания символов

        • ABBYY предоставляет встроенный редактор изображений для исправления сканов, повышая читаемость текста.
        • При выборе по умолчанию изображение будет пытаться интеллектуально исправить изображение, чтобы механизм OCR мог легче распознавать текст. Вы также можете редактировать сканы вручную.

        Использование редактора изображений

        1. Щелкните правой кнопкой мыши файл PDF с именем «PlantPestsCT.pdf» и выберите «Открыть с помощью ABBYY FineReader 14».
        2. Нажмите раскрывающийся список «Распознать текст» и выберите «Открыть в редакторе OCR».
          • Вы увидите, что качество распознанного текста очень низкое. Мы можем использовать встроенные инструменты редактирования изображений, чтобы повысить точность распознавания текста.
        3. Нажмите «Редактор изображений». Это откроет новый интерфейс в ABBYY для редактирования изображений с целью улучшения качества оптического распознавания символов.
        4. Есть несколько задач, которые мы можем решить, чтобы улучшить качество распознавания:
          • Вырезать ненужные функции.
          • Изменить цвет фона на белый
          • Увеличить контрастность или яркость
          • устранить перекос слов/строк
          • Удалить шум и метки
        • Редактировать можно одну страницу, четные или нечетные страницы, или все страницы.

        Создание шаблонов

        Шаблоны областей позволяют нам идентифицировать все текстовые поля на одной странице и применять идентичный макет к другим страницам. Мы даже можем сохранить эти шаблоны для использования в других проектах ABBYY.

        Создать шаблон области

        1. Выберите страницу 2 и нарисуйте зеленую текстовую рамку вокруг основного блока текста.
          • Нажмите правой кнопкой мыши на любое существующее зеленое текстовое поле и выберите "Удалить". Эти поля содержат номера страниц, водяные знаки и другой текст, который мы не хотим включать (обратите внимание, что при этом также будут игнорироваться любые изображения на странице).
        2. Выберите «Область» в верхнем меню и выберите «Сохранить шаблон области».
          • Назовите шаблон «trees_even.blk» и сохраните.
        3. Теперь выберите страницу 3 и повторите шаги 1 и 2 выше.
          • Назовите шаблон «trees_odd.blk».
        4. На панели инструментов "Страницы" нажмите на три точки, "Выбрать страницы", а затем "Четные страницы".
        5. Выделив четные страницы, выберите «Область» в верхнем меню, выберите «Загрузить шаблон области» и выберите «trees_even.blk».
        6. Повторите шаги 4 и 5, используя нечетные страницы и нечетный шаблон.
        7. Снова «распознайте» текст и посмотрите, как изменится вывод.
        8. Читайте также: