Размер файла при сканировании зависит от чего

Обновлено: 03.07.2024

Я пытаюсь отсканировать обычные документы размером 8,5 x 11 дюймов в черно-белом режиме с разрешением 300 точек на дюйм в соответствии с требованиями получателя, но полученные файлы PDF слишком велики для отправки по электронной почте. Получатель (государственное учреждение) говорит, что типичный 22-страничный PDF-файл должен весить менее 2 МБ. Но, черт возьми, я сканирую одну паршивую страницу, и она весит от 5 до 7 МБ.

Я использую HP Photosmart C4580 и MacBook Pro под управлением Snow Leopard. Я пробовал сканировать из Preview, сканировать с помощью Image Capture и с помощью приложения HP Scan. Все так же. Всякий раз, когда я пытаюсь уменьшить размер файла до или после сканирования, изображение становится нечитаемым. И это не доступный для поиска текст, поэтому я не думаю, что это проблема. Любые предложения приветствуются! Спасибо.

MacBook Pro, Mac OS X (10.6.8)

Опубликовано 2 июля 2011 г., 9:56

Полезные ответы

Открыть в режиме предварительного просмотра.

Выберите кварцевый фильтр – черно-белый.

Мне помогло, когда я отсканировал с помощью своего HP и уменьшил его до удобного размера, который все еще выглядел хорошо.

2 июля 2011 г., 9:59

Еще один вариант – открыть ColorSync в папке "Утилиты" --> фильтровать --> уменьшить размер заливки --> применить.

2 июля 2011 г., 10:58

Беседа не о чем

Загрузка содержимого страницы

Содержимое страницы загружено

Открыть в режиме предварительного просмотра.

Выберите кварцевый фильтр – черно-белый.

Мне помогло, когда я отсканировал с помощью своего HP и уменьшил его до удобного размера, который все еще выглядел хорошо.

2 июля 2011 г., 9:59

Еще один вариант – открыть ColorSync в папке "Утилиты" --> фильтровать --> уменьшить размер заливки --> применить.

2 июля 2011 г., 10:58

Спасибо за быстрые ответы! Черно-белый кварцевый фильтр уменьшил размер каждой страницы примерно с 5 МБ до примерно 500 КБ с минимальной потерей деталей. Довольно существенная экономия места, но, к сожалению, этого недостаточно, чтобы удовлетворить лимит вложений электронной почты клиента. Раньше я никогда не игрался с утилитой ColorSync. Он еще лучше справился с уменьшением размера файла до менее 200 КБ. К сожалению, они вышли размытыми.

Интересное примечание: проблемы с размытием были только на страницах, которые я отсканировал с бумаги. Три или четыре страницы, которые я сохранил из Интернета, сохранили свою резкость даже после уменьшения размера файла.

На данный момент я решил проблему с помощью обмана, заставив Office Depot сканировать мои страницы. Им удалось отсканировать 17 страниц в PDF с общим размером файла менее 1 МБ. Я не спрашивал их, как. Я поиграю со своим сканером и настройками позже. Еще раз спасибо!

2 июля 2011 г., 17:38

вместо того, чтобы выбирать черно-белое изображение, выберите текст, если у вас есть такая возможность

12 марта 2015 г., 12:38

От 5 до 7 МБ для изображения формата Letter в градациях серого с разрешением 300 точек на дюйм — это правильный размер для высококачественного изображения JPEG или изображения RGB со средним сжатием. Я знаю, что вы сказали PDF, но нет такой вещи, как сканирование PDF. Это сканирование такое же, как и любое другое сканирование — растровое изображение — за исключением того, что оно на лету встраивается в файл-контейнер PDF.

Все зависит от того, какой уровень сжатия вы используете для JPEG, который определяет, насколько маленькими будут файлы. Чем выше степень сжатия, тем меньше размер файла. Уменьшение размера 17 страниц формата Letter с разрешением 300 dpi до менее 1 МБ означает, что они использовали очень сильное сжатие. И, скорее всего, как изображения в градациях серого. Что, если это только текст, вы действительно можете избежать этого и получить читаемый документ. Вы бы не хотели делать это с изображениями.

12 марта 2015 г., 13:01

Дэн Хаббелл написал:

Я пытаюсь отсканировать обычные черно-белые документы размером 8,5 x 11 дюймов с разрешением 300 dpi в соответствии с требованиями получателя, но результирующие файлы PDF имеют размер слишком большой для электронной почты. Получатель (государственное учреждение) говорит, что типичный 22-страничный PDF-файл должен весить менее 2 МБ. Но, черт возьми, я сканирую одну паршивую страницу, и она занимает от 5 МБ до 7 МБ.

Я использую HP Photosmart C4580 и MacBook Pro под управлением Snow Leopard. Я пробовал сканировать из Preview, сканировать с помощью Image Capture и с помощью приложения HP Scan. Все так же. Всякий раз, когда я пытаюсь уменьшить размер файла до или после сканирования, изображение становится нечитаемым. И этот текст не доступен для поиска, так что я не думаю, что это проблема.

Курт Лэнг дал правильный ответ. Я бы добавил, что скорее всего агентство, с которым вы имеете дело, использует Adobe Acrobat. Их PDF-файлы будут состоять из текста, а не изображений. Текстовый PDF-файл будет немного меньше, чем PDF-файл, состоящий из изображения, независимо от используемого сжатия.

Вы также затронули тему того, что ваши сканы не являются текстом для поиска. Неясно, хочет ли ваш получатель текстовый PDF с возможностью поиска. Если им нужен доступный для поиска текст, вам придется вручную ввести текст в текстовом редакторе или использовать программное обеспечение для оптического распознавания символов на отсканированных изображениях.

Сканер

Отсканированные документы могут привести к большим графическим файлам, которые слишком велики для отправки по электронной почте. Я рассмотрю варианты для получения более управляемых результатов.

Я отсканировал копию своей формы W2 и попытался отправить ее кому-нибудь по электронной почте, но мне сказали, что файл слишком большой — более 25 МБ. Как простой текстовый документ приобретает такой огромный объем?

Сканирование документа создает изображение. Это точно так же, как если бы вы направили камеру на бумагу и сфотографировали ее, за исключением того, что ваш сканер лучше справляется с большими плоскими поверхностями.

И картинки могут быть большими.

Давайте посмотрим, почему, и некоторые альтернативы.

TL;DR:
< /p>

Сканирование документов

Сканирование эквивалентно фотографированию документа. Варианты уменьшения результирующего файла: используйте OCR, чтобы вернуть только текст, найденный на картинке, сканируйте с более низким разрешением или сохраняйте файлы .jpg с более низкими настройками качества.

Текст и изображение

Вот текст:

Это ровно восемь байтов: по одному на каждую букву, один на пробел и один на восклицательный знак.

А вот изображение этого текста:

Это изображение — в данном случае файл «.jpg» — имеет размер 2431 байт, что более чем в 300 раз превышает размер, необходимый для представления текста.

Разница проста: в то время как текст может быть представлен восемью байтами, каждый из которых представляет один символ в строке, изображение представляет собой набор информации, описывающий каждый пиксель изображения, в данном случае 133× 40 изображений, содержащих 5320 пикселей. Это просто требует больше данных для представления.

Результаты сканирования в виде изображения

Как я уже сказал, сканирование документа почти то же самое, что фотографирование листа бумаги с помощью камеры. Действительно, на многих смартфонах теперь есть приложения именно для этой цели: наведите камеру устройства на документ, сделайте снимок, и вы его «отсканировали». Я постоянно делаю это с квитанциями по кредитным картам.

Изображение с камеры может быть довольно большим, в зависимости от ряда различных факторов, и сканирование ничем не отличается. Ваш скан, вероятно, представляет собой файл .jpg или .jpg (оба являются графическими форматами файлов) или, возможно, файл PDF, содержащий изображения (хранящиеся внутри как .jpg или .jpg). Результатом сканирования является не простой документ или текстовый файл.

В вашем случае в результате сканирования файл оказался слишком большим для отправки по электронной почте. Есть способы сделать его меньше.

Связанные

Управляете большим количеством отсканированных документов? Иногда само количество может представлять проблему. Проверьте, как я могу управлять большим количеством отсканированных документов? для моего подхода.

Вариант 1: OCR

Для преобразования изображения отсканированного документа в текст, который можно редактировать, требуется так называемое OCR для оптического распознавания символов.

Есть несколько подходов. Ваше программное обеспечение для сканирования может выполнить эту задачу за вас и сделать редактируемый текст частью результирующего файла. Мой сканер ScanSnap, например, создает PDF-файл каждого сканируемого документа, который содержит изображение каждой страницы, а также результаты распознавания текста на изображении. Ирония, конечно, в том, что включение обоих делает результирующий документ еще больше.

Одна из проблем OCR, помимо точности, заключается в том, что он фокусируется на тексте (или символах) на отсканированной странице, а не на форматировании. OCR дает вам текст, но обычно все форматирование теряется в процессе. Иногда это идеально и именно то, что вы хотите. Почти наверняка оно будет меньше изображения документа.

Но иногда — как, я полагаю, в случае с вашим W2 — вам действительно нужна копия, которая выглядит так же, как оригинал. Вот когда вам нужна эта картинка.

Вариант 2. Разрешение сканирования

Двадцать пять мегабайт кажутся слишком большими для простого одностраничного документа.

Большинство сканеров имеют параметр, определяющий степень детализации изображения документа. Это измеряется «DPI» или количеством точек на дюйм.

Простой текстовый документ обычно можно отсканировать с разрешением всего 75 точек на дюйм и получить вполне приемлемые результаты.

Ваш сканер может быть настроен на более высокое разрешение или по умолчанию. Поскольку сканеры часто используются для сканирования фотографий, где разрешение и детализация гораздо важнее, они имеют гораздо более высокие настройки DPI. Мой планшетный сканер, который я использую для сканирования старых фотографий, может достигать 2400 точек на дюйм. При этом генерируется значительно больше данных для каждого отсканированного элемента, а результирующие файлы пропорционально намного больше по сравнению со сканированием с разрешением 75 DPI.

Я определенно рассмотрю настройку разрешения сканирования в качестве следующего шага к уменьшению размера файла ваших отсканированных изображений.

Вариант 3. Настройте сжатие

Если ваш сканер создает файл ".jpg" или может создать его, есть еще одна настройка, которую вы можете попытаться найти: настройка качества jpg.

То, где именно это будет находиться, и даже как оно называется, к сожалению, зависит от используемого вами программного обеспечения, поэтому я не могу точно сказать, что искать. Часто это число от 1 до 10 (хотя, опять же, часто используются и другие диапазоны), что позволяет найти компромисс между размером результирующего файла и его качеством. Более красивый файл будет больше, чем файл более низкого качества.

Выберись из ада бесплатно - Высокое качество» width=

Выберись из ада бесплатно - Низкое качество» width=

На двух изображениях выше первое сохранено в формате jpg с высоким качеством и имеет размер примерно 75 КБ. Второй в низком качестве и весит 23 КБ. Вы можете видеть, что второй значительно менее четкий и четкий, чем первый. В зависимости от документа, с которым вы имеете дело, это может быть приемлемым компромиссом для изображения значительно меньшего размера.

Сделать это

Подпишитесь на Confident Computing! Меньше разочарований и больше уверенности, решения, ответы и советы в вашей почте каждую неделю.

Большой размер файла подходит для печати или для компакт-диска, но для использования в Интернете вам потребуется файл небольшого размера для более быстрой загрузки.

1. Размер файла изображения:

Прежде всего при выборе изображения учитывается размер файла, помимо качества изображения (разрядность, количество цветов, обрезка при редактировании), а также размера изображения и размера экрана. (Обратите внимание, что размер файла, размер изображения и размер экрана – разные свойства.)
Размер файла изображения зависит от разрешения и масштаба, в котором оно сканируется, -- от размера изображения и формата, в котором это сохранено.

Разрешение для сканирования:

  • Используйте максимально доступное изображение для печати в иллюстрированной книге или глянцевом журнале.
  • Используйте разрешение 300 или 600 dpi (точек на дюйм) для печати на цветном принтере.
  • Используйте разрешение 72–96 dpi для изображения, которое вы хотите отправить по электронной почте, разместить на доске или на любой веб-странице.

Масштаб для сканирования -- рекомендуется -- попробуйте:

  • Для слайда шириной 35 мм используйте значение 300%.
  • Для открытки или фотографии аналогичного размера используйте 50%.
  • Для рукописного текста, графика или карты используйте значение 100 % или выше, если вы выбираете только детали оригинала.

Форматы изображений:

  • Изображение в формате .tiff (файл изображения с тегами) или .bmp (растровое изображение) идеально подходит: в нем есть каждый пиксель. Он удобен для редактирования или печати, но слишком велик для электронной почты или Интернета.
  • Для отправки по электронной почте или в Интернете вы хотите сохранить изображение в формате jpg/jpeg или gif. Оба сжимают файл изображения, поэтому они являются «форматами с потерями», но потеря не обязательно заметна на экране, если вы начинаете с хорошего изображения. Чем выше сжатие, тем больше потери, тем меньше размер файла. Попробуйте каждый формат, используя одинаковую степень сжатия, затем сравните качество и размер файла и выберите тот или иной. Формат .jpg лучше подходит только для изображений с небольшим количеством цветов, таких как некоторые флаги или ч/б, и если вам нужен прозрачный фон.

Размер изображения и размер экрана:

Предположим, у нас есть очень большое изображение, 640 x 480 пикселей.
Это заполняет весь экран монитора, настроенного на отображение VGA (640 x 480), и, вероятно, требует небольшой прокрутки, поскольку часть экрана может использоваться для верхней и нижней полос и полосы прокрутки на правильно.
Но на мониторе, обычно настроенном на SVGA (800 x 600 или, редко, 1024 x 768), все изображение должно быть видно без прокрутки.

Помните, что вы не можете контролировать настройки дисплея пользователя.

Иногда для отображения деталей требуется очень большое изображение. Если нет, обрежьте и измените размер изображения (желательно во время сканирования) до более удобного для пользователя размера изображения, не требующего прокрутки.

Размер изображения, формат, масштаб сканирования и размер файла:

Открытка 6,5 x 4,5 дюйма, сохраненная в формате .формат jpg -- изображения разных размеров:
масштаб сканирования
размер файла
миниатюра: 10%
2 КБ
20%
< /td>
6 КБ
50%
20 КБ
100 % – загружается медленнее и требуется редко, за исключением отображения деталей, скажем, на рисунке, графике, карте
87 КБ

Зебра — размер изображения 400 x 561 пикселей:
< td style="vertical-align: top;">657 КБ
format
размер файла
Растровое изображение — .bmp
1% сжатие — ,jpg
144 КБ
40 % сжатия - ,jpg 24 КБ
Сжатие 70% - ,jpg -- заметной разницы в качестве изображения нет, но загружается намного быстрее
16 КБ

Проверьте свойства изображения. На компьютере щелкните изображение правой кнопкой мыши, выберите "Свойства".

2. Размер текстового файла зависит от формата, который вы выбираете с помощью функции «Сохранить как» — все размеры файлов ниже для одного и того же документа:

Сканирование в лаборатории факультета Lehman в библиотеке -- не делает слайды:

Откройте крышку сканера: коснитесь ее обращенной к вам стороны и поднимите ее назад.
Не прикасайтесь к стеклу сканера.
Вставьте материал напечатанной стороной вниз, верхним краем страницы справа.
Закройте крышку.

На рабочем столе щелкните HP Director — откроется его главное диалоговое окно.
Нажмите «Настройки» — выберите нужный вариант, например язык, если вы сканируете текст на иностранном языке.
Нажмите Сканировать документ.
В следующем диалоговом окне выберите параметр, например, сканировать как изображение или сканировать как редактируемый текст.
Затем выберите место назначения, например, MS Word.
Затем нажмите «Сканировать», отрегулируйте по мере необходимости — вы можете выбрать только прямоугольник, повысить резкость, затемнить или повернуть текст.
Затем нажмите "Принять".

Если вы решили отсканировать страницу как изображение, вы получите изображение в формате .jpg.
Если вы выбрали сканирование в виде редактируемого текста, он автоматически появится в выбранном вами месте назначения, например в MS Word. Вам будет предложено отсканировать другую страницу в тот же файл. Проверьте и исправьте перед сохранением файла.


Материалы, пригодные для сканирования:
Все должно быть отличного качества, особенно текст.
Чисто напечатанные отдельные страницы работают нормально.
Распечатанные изображения, фотографии, открытки, слайды работают нормально, но могут потребовать тщательного редактирования.

Не утруждайте себя сканированием коротких отрывков текста или заметок с кофейными пятнами, нечеткими или слишком темными факсами, курсивом очень мелким шрифтом и т. д. — перепечатывать текст быстрее, чем сканировать и вычитывать.
Книги в переплете или толстые журналы плохо сканируются. Корешок не позволяет страницам ровно лежать на сканере, а обложке плотно закрываться целиком, поэтому проникает посторонний свет, который создает тени — почти черные на толстых томах — которые могут закрывать текст каждой строки. недалеко от центра.
Если я не хочу испортить том, сломав корешок или вырезав страницы, я отношу том в копировальный магазин, чтобы получить хорошую копию каждой страницы. Там у них есть тяжелые гибкие покрытия, которые защищают от внешнего света. Каждая страница должна быть скопирована отдельно, иначе текст будет искривлен.
В качестве альтернативы можно использовать ручной сканер, который, однако, требует очень твердой руки или направляющей.
Сканирование страницы с текстом, наложенным на изображение, но не отделенным от него: хотя вы можете отделить текст от изображения, вы не можете отделить изображение от текста.

Кливлендский государственный университет

Если ваш файл слишком велик для загрузки, эти советы по оптимизации файлов помогут уменьшить размер файла:

При использовании сканера разрешение сканирования определяет размер отсканированного изображения. Используйте разрешение 72 точки на дюйм (dpi), чтобы получить изображение в натуральную величину при отображении на экранах большинства компьютеров.Поскольку экраны компьютеров отображают только около 72 пикселей на дюйм, использование более высокого разрешения сделает размер файла излишне большим.

Используйте программное обеспечение для работы с цифровыми изображениями, чтобы обрезать ненужные части изображения.

Используйте формат .jpg, если вам не нужно много цветов. Например, в этом формате хорошо работают простые рисунки, фигуры и маленькие значки. Вы можете оптимизировать изображения .jpg, уменьшив количество цветов. Чем меньше цветов вы используете, тем меньше размер файла. Начните с 256 цветов и уменьшайте количество цветов до тех пор, пока не заметите разницу в изображении.

Используйте формат .jpg при работе с фотографиями. При появлении запроса вы можете оптимизировать изображения .jpg, выбрав более низкое качество. Сохранение по умолчанию для .jpg в большинстве программ установлено на 10, самое высокое качество. Вы можете попробовать уменьшить его до меньшего числа, в зависимости от необходимости четкого изображения для вашего проекта. Чем ниже качество, тем меньше размер файла. Начните с максимального качества и уменьшайте качество изображения до тех пор, пока не заметите разницу в изображении.

Уменьшите размер изображения с помощью графического редактора (например, Adobe Photoshop или Microsoft Photo Editor). Чем меньше размеры изображения, тем меньше размер файла.

Обрезка изображения в PowerPoint НЕ УМЕНЬШИТ размер файла.

Когда вы изменяете размер изображения в такой программе, как PowerPoint, вы только уменьшаете изображение на экране — фактический размер файла изображения совсем не уменьшается.

По возможности размер отдельных изображений не должен превышать 200 КБ. Максимальный размер всех изображений в презентации по возможности не должен превышать 4 МБ.

Включите пустой слайд в начало презентации. Казалось бы, добавление пустого слайда в начале презентации увеличило бы размер файла; однако верно и обратное. Пустой слайд служит изображением для предварительного просмотра — изображение, которое PowerPoint отображает при выборе файла в диалоговом окне «Открыть». Поскольку пустой слайд намного проще, чем настоящий первый слайд, изображение для предварительного просмотра намного меньше, что уменьшает размер файла презентации.

Чтобы загрузить видео в TaskStream, его необходимо сжать до размера файла не более 100 МБ.

Измените разрешение. 320 x 240 и 640 x 480 – это стандартные разрешения для загрузки видео в Интернет.

Изменить частоту кадров (количество кадров в секунду). Снижение частоты кадров уменьшит размер файла. Обратите внимание, что при чрезмерном использовании это может снизить качество видео.

Изменить качество звука. Небольшое снижение качества звуковой дорожки поможет уменьшить размер файла

Вы также можете разделить видео на несколько разделов. Затем каждую часть можно загрузить в TaskStream отдельно и перечислить в хронологическом порядке, назвав файлы соответствующим образом. Можно загружать несколько видеофайлов в TaskStream, если не превышено общее пространство для хранения файлов вашей учетной записи и если размер каждого видеофайла составляет 100 МБ или меньше. Однако обратите внимание, что в зависимости от качества вашего видео каждый раздел может нуждаться в дополнительном сжатии, чтобы уменьшить его размер до 100 МБ.

Обратите внимание, что, поскольку сжатие видео и обработка видео происходят за пределами TaskStream, мы можем предоставить только ограниченную поддержку и не одобряем и не поддерживаем какую-либо конкретную видеопрограмму.

Читайте также: