Каков стандарт представления изображений, полученных со сканера
Обновлено: 20.11.2024
Файлы изображений могут содержать информацию о содержимом изображений, растровых изображениях и метаданных изображений. Обычно данные о данных называются метаданными. В этом случае метаданные относятся к дополнительной информации о реальных изображениях, которая хранится в файлах изображений вместе с изображениями.
5.1 Понятия метаданных
В файле изображения может храниться несколько типов метаданных, и каждый тип может служить разным целям. Один тип, технические метаданные, используется для описания изображения в техническом смысле. Например, технические метаданные могут включать атрибуты изображения, такие как его высота и ширина в пикселях или тип сжатия, используемый для его хранения. Другой тип, метаданные содержания, может дополнительно описывать содержание изображения, имя фотографа, а также дату и время, когда была сделана фотография.
Метаданные хранятся в файлах изображений с использованием различных механизмов. Цифровые камеры и сканеры автоматически вставляют метаданные в создаваемые изображения. Приложения для обработки цифровых фотографий, такие как Adobe Photoshop, позволяют пользователям добавлять или редактировать метаданные, которые будут храниться вместе с изображением. Аннотирование цифровых изображений дополнительными метаданными является обычной практикой в приложениях для сбора фотографий и новостей, а также для архивирования изображений, а также на потребительском уровне.
Хранение метаданных вместе с данными изображения в одном содержащем файле обеспечивает инкапсуляцию. Благодаря инкапсуляции оба типа данных могут совместно использоваться и надежно обмениваться как единое целое. Метаданные, хранящиеся в формате файла изображения, называются встроенными метаданными .
5.2 Концепции метаданных Oracle inter Media Image
Для большого количества форматов файлов изображений Oracle inter Media ("inter Media") может извлекать и управлять ограниченным набором атрибутов метаданных. К этим атрибутам относятся: высота, ширина, длина содержимого, формат файла, формат содержимого, формат сжатия и тип миметипа. Inter Media может извлекать богатый набор атрибутов метаданных для ограниченного числа форматов файлов изображений. Эти метаданные представлены в XML-документах на основе схемы. Эти XML-документы можно хранить в базе данных, индексировать, выполнять поиск, обновлять и делать доступными для приложений с помощью стандартных механизмов базы данных Oracle.
inter Media также может записывать или встраивать метаданные, предоставленные пользователями, в ограниченное число форматов файлов изображений. Приложение предоставляет метаданные в виде XML-документа на основе схемы. Inter Media обрабатывает XML-документ и записывает метаданные в файл изображения.
5.3 Форматы файлов изображений
inter Media поддерживает извлечение метаданных и встраивание метаданных для форматов файлов GIF, TIFF и JPEG. Информацию о форматах файлов изображений, поддерживаемых inter Media, см. в справочнике Oracle interMedia.
5.4 Форматы метаданных изображения
Термин формат метаданных изображения относится к стандартным протоколам и методам, используемым для хранения метаданных изображения в файле изображения. В следующих подразделах описываются форматы метаданных встроенного изображения, поддерживаемые inter Media:
5.4.1 EXIF
Exchangeable Image File Format (EXIF) — это стандарт хранения файлов изображений для цифровых фотокамер. Он был разработан Японской ассоциацией развития электронной промышленности (JEIDA) в качестве стандартного способа хранения изображений, созданных цифровыми камерами, а также метаданных об изображениях. Метаданные изображения EXIF могут храниться в изображениях форматов TIFF и JPEG. Inter Media поддерживает извлечение метаданных EXIF из форматов файлов TIFF и JPEG.
5.4.2 IPTC-IIM
Модель обмена информацией Международного совета по телекоммуникациям прессы (IPTC-IIM), версия 4, — это стандарт, разработанный совместно Международным советом по телекоммуникациям прессы и Американской газетной ассоциацией. Этот стандарт метаданных предназначен для сбора информации, важной для деятельности по сбору новостей, составлению отчетов и публикации. Эти информационные записи обычно называются тегами IPTC.
Использование встроенных тегов IPTC в форматах файлов изображений стало широко распространенным с использованием инструмента Adobe Photoshop для редактирования изображений. Метаданные IPTC могут храниться в изображениях форматов TIFF и JPEG. Inter Media поддерживает извлечение метаданных IPTC из форматов файлов TIFF и JPEG.
5.4.3 XMP
Расширяемая платформа метаданных (XMP) — это стандартный формат метаданных, разработанный Adobe для создания, обработки и обмена метаданными в различных приложениях. XMP использует технологию Resource Description Framework (RDF) для моделирования данных. XMP также определяет, как модель данных сериализуется (преобразуется в поток байтов) и встраивается в файл изображения. Inter Media поддерживает извлечение метаданных XMP из форматов файлов GIF, TIFF и JPEG. Inter Media также поддерживает запись пакетов данных XMP в форматы файлов GIF, TIFF и JPEG.
Дополнительную информацию о XMP см. на веб-сайте Adobe Systems Incorporated по адресу
Дополнительную информацию о RDF см. на веб-странице Resource Description Framework на веб-сайте World Wide Web Consortium по адресу
5.5 Представление метаданных вне изображений
После извлечения метаданных из файла двоичного изображения следующим шагом является представление метаданных в форме, которую можно легко хранить, индексировать, запрашивать, обновлять и представлять. inter Media возвращает метаданные изображения в XML-документах. Эти документы основаны на XML-схемах, которые Inter Media регистрируют в базе данных. Каждый тип метаданных изображения имеет отдельную XML-схему. Эти XML-схемы используются методами метаданных типа объекта ORDImage. Полные определения XML-схем, поддерживаемых inter Media, см. в справочнике Oracle interMedia.
Документы XML могут храниться в столбцах XMLType в базе данных. Эти документы легко найти и обработать, используя широкий спектр основанных на стандартах XML-технологий, предоставляемых Oracle XML DB. (Дополнительную информацию см. в Руководстве разработчика Oracle XML DB.)
5.6 Примеры метаданных изображений Oracle inter Media
В следующих примерах извлечения и внедрения метаданных используется таблица фотографий. Таблица photos определяется образцом приложения Photo Album. Реализация примера приложения Photo Album определена в пакете PL/SQL с именем PHOTO_ALBUM. См. Главу 3 для получения полного описания примера приложения «Фотоальбом» из набора Inter Media PL/SQL Web Toolkit.
В таблице фотографий хранятся два экземпляра изображения: полноразмерная фотография и уменьшенное изображение. В этой таблице также может храниться до четырех различных документов метаданных изображения. Эти документы хранятся в столбцах с именами metaORDImage , metaEXIF , metaIPTC и metaXMP и представляют метаданные изображения из форматов метаданных ORDImage , EXIF , IPTC и XMP соответственно. Столбцы метаданных имеют тип XMLType и привязаны к соответствующим XML-схемам метаданных, которые предоставляет Inter Media.
5.6.1 Создание таблицы для хранения метаданных
Для удобства использования операторы кода, в которых определяются столбцы метаданных изображения и привязываются к схемам XML, выделены жирным шрифтом.
5.6.2 Извлечение метаданных изображения
Следующая процедура PL/SQL извлекает метаданные из изображения и сохраняет их в указанных столбцах созданной вами таблицы фотографий. Эта процедура демонстрирует метод getMetadata(), возвращающий массив XML-документов. Корневой элемент каждого документа проверяется для определения типа метаданных. Оператор UPDATE сохраняет документы в соответствующих столбцах таблицы фотографий.
Для удобства использования оператор кода, в котором вызывается метод getMetadata(), выделен жирным шрифтом.
5.6.3 Встраивание метаданных изображения
Следующая процедура PL/SQL демонстрирует метод putMetadata(). Эта процедура принимает шесть аргументов. Аргумент entry_id идентифицирует изображение в таблице photos, которое необходимо обновить. Остальные аргументы (название, создатель, дата, описание и авторские права) представляют собой строки, которые будут отформатированы в пакет XMP и встроены в целевое изображение.
В этом примере создается экземпляр XML-документа на основе схемы XML inter Media для метаданных XMP. (Эта схема предварительно зарегистрирована в Oracle XML DB. Дополнительные сведения см. в Руководстве разработчика Oracle XML DB.) Схема для метаданных XMP определяет один глобальный элемент. Элемент содержит один правильно сформированный RDF-документ. Документ RDF содержит один элемент, производный от пространства имен rdf. Этот документ RDF построен с использованием элементов, определенных схемой Dublin Core.
Вызов метода putMetadata() встраивает документ метаданных в файл изображения. Оператор UPDATE сохраняет новое изображение и новые метаданные обратно в таблицу фотографий.
Для удобства использования оператор кода, в котором вызывается метод putMetadata(), выделен жирным шрифтом.
5.7 Ссылки на метаданные
Следующие веб-сайты предоставляют информацию о стандартах и технологиях, связанных с работой с метаданными в изображениях.
Dublin Core, стандартная схема для основных элементов Dublin
Расширяемая платформа метаданных
Структура описания ресурсов (см. RDF Primer)
5.8 Извлечение и сопоставление атрибутов метаданных DICOM в изображениях
Функция цифровой обработки изображений и связи в медицине (DICOM) позволяет Inter Media распознавать отдельные объекты DICOM и извлекать набор атрибутов, связанных с пациентом, исследованием, серией и оборудованием. Распознавание объекта DICOM означает, что inter Media может определить, представляют ли данные двоичные данные отдельный объект DICOM. Если это так, Inter Media может извлечь метаданные DICOM из этого объекта DICOM. Данные могут храниться как содержимое объекта ORDImage или непосредственно в BLOB или BFILE.
Объекты DICOM — это объекты, которые могут хранить различные типы данных. Примеры включают административную информацию пациента, кривые, изображения, срезы трехмерных объемов, сегменты видео и изменяющиеся во времени трехмерные объемы. Отдельный объект DICOM должен иметь заголовок файла, соответствующий стандарту DICOM.
Стандарт DICOM был инициирован Американским колледжем радиологии (ACR) для расширения возможностей подключения рентгенологических устройств. До того, как DICOM стал широко распространенным стандартом, каждый производитель имел свой собственный формат изображения и протокол связи, что делало почти невозможным создание стороннего программного обеспечения для управления или изучения медицинских данных. Также не удалось подключить устройства разных производителей. В 1985 году Американский колледж радиологии и Национальная ассоциация производителей электрооборудования (NEMA) совместно опубликовали стандарт медицинской визуализации и связи, названный стандартом ACR-NEMA, для решения этой проблемы. В 1993 году стандарт был пересмотрен и переименован в DICOM (версия 3.0). С тех пор стандарт DICOM стал доминирующим стандартом для рентгенологических изображений и связи. Все основные производители соответствуют этому стандарту. Сегодня любой программный компонент может получать данные DICOM от любого производителя и управлять ими с помощью единого интерфейса.
Подробнее о методах DICOM, правилах кодирования, формате изображения и исключениях, поддерживаемых inter Media, см. в справочнике Oracle interMedia.
5.9 Формат файла изображения DICOM
inter Media поддерживает извлечение метаданных для формата файла изображения DICM. DICM — это межмедийное обозначение формата цифровых изображений и коммуникаций в медицине. Дополнительную информацию о форматах файлов изображений, поддерживаемых inter Media, см. в справочнике по Oracle interMedia.
5.10 Пример метаданных изображения Oracle inter Media DICOM
В следующем примере извлечения метаданных DICOM используется таблица medicalImages, которая определена в примерах сегментов кода PL/SQL, описанных в следующих подразделах.
В таблице medicalImages хранятся два экземпляра изображения: полноразмерная фотография и уменьшенное изображение. В этой таблице также может храниться один документ метаданных изображения. Этот документ хранится в столбце с именем metadata и представляет метаданные изображения DICOM из формата метаданных DICM. Столбец метаданных имеет тип XMLType и привязан к соответствующей XML-схеме метаданных, которую предоставляет Inter Media.
5.10.1 Создание таблицы для хранения метаданных DICOM
Для удобства использования операторы кода, в которых определяется столбец метаданных изображения и привязывается к схеме XML, выделены жирным шрифтом.
5.10.2 Извлечение метаданных изображения DICOM
Следующая процедура PL/SQL извлекает метаданные DICOM из изображения и сохраняет их в указанном столбце созданной вами таблицы medicalImages. Эта процедура демонстрирует метод getDicomMetadata(), возвращающий XML-документ. Оператор UPDATE сохраняет документ в соответствующем столбце таблицы medicalImages.
Для удобства использования оператор кода, в котором вызывается метод getDicomMetadata(), выделен жирным шрифтом.
5.11 Ссылки на DICOM
Следующие веб-сайты содержат информацию о стандартах медицинской визуализации и проблемах, связанных с DICOM.
Цифровая визуализация и коммуникации в медицине
Стандарт NEMA: цифровые изображения и коммуникации в медицине (DICOM) от PS3-1 до PS3-16. НЭМА, 2003 г.
«Отсканированное изображение» или «изображение документа» — это, как следует из названия, изображение (изображение) документа. Сканеры документов — это просто причудливые камеры, которые делают снимок документа. Сканеры с устройством автоматической подачи документов (АПД) будут перемещать страницы через объектив камеры особого типа (для ботаников это называется ПЗС), а компьютерный процессор внутри сканера будет собирать множество маленьких изображений в одно изображение, представляющее документ. страница документа (а также множество других интересных функций).
В сканировании документов есть много переменных, многие из которых выходят за рамки этой статьи. Ниже мы постараемся предоставить вам необходимую информацию.
Типы отсканированных изображений
Вот некоторые наиболее подходящие типы отсканированных изображений:
- Двухцветный или черно-белый. В этом режиме сканер ищет только 2 цвета (технически 1) для каждого пикселя. Это создает минимально возможное изображение, поскольку каждый пиксель документа может быть представлен одним компьютерным битом (см. рисунок справа).
- Цвет — в этом режиме сканер ищет несколько цветов для каждого пикселя. С бесконечным спектром цветов вы можете себе представить, как цветной файл может быть намного больше по размеру, чем черно-белый. Большинство сканеров допускают несколько настроек «глубины цвета», которые определяют, сколько возможных цветов содержится в каждом пикселе. Чем выше глубина цвета, тем больше размер файла. Более высокая глубина цвета, как правило, улучшает качество цветного изображения (до определенного предела).
- Оттенки серого — аналогично цвету, за исключением того, что цвета ограничены оттенками серого. Обычно не используется для визуализации документов.
Пиксели и DPI
Пиксель – это маленькая точка на странице, которую сканирует сканер. Одной из наиболее важных настроек при сканировании бумажного документа является количество точек на дюйм, или DPI, поскольку от этого зависит качество изображения и размер файла. DPI — это количество пикселей на квадратный дюйм изображения. Например, 300 DPI означает, что количество пикселей в дюйме составляет 300×300 или 90 000. См. рекомендации ниже по настройке DPI в вашем сканере.
Сжатие
Хорошо, теперь мы совсем зануды, зачем нам сжатие? Сжатие становится очень важным, если у вас его нет. Почти все изображения хранятся с некоторым сжатием, чтобы уменьшить размер файла и упростить перемещение изображения. Файл JPG, например, использует тип сжатия, который очень эффективен при хранении фотографий. Один из самых популярных способов хранения черно-белого изображения — в формате TIFF со сжатием CCITT T.4. Хорошая новость заключается в том, что лучшие сканеры обычно делают все это за вас, и вам не нужно об этом беспокоиться.
Предупреждение о сжатии: некоторые типы сжатия фактически приводят к потере данных в изображении. Это называется «сжатием с потерями». В большинстве случаев потеря не имеет значения, потому что достаточно оригинала сохраняется для просмотра человеком. JPG — самый популярный тип сжатия, и это сжатие с потерями. Сжатие TIFF CCITT T.4 осуществляется без потерь, поэтому его обычно рекомендуют для черно-белого сканирования. Чтобы представить это в перспективе — практически каждый фотографический процесс теряет данные — это просто природа фотографии. Таким образом, процесс сканирования означает, что вы создаете копию оригинала более низкого качества. С юридической точки зрения вы должны осознавать, что и как вы сканируете, чтобы гарантировать, что потеря данных не изменит улики. В некоторых случаях можно вообще не сканировать, как описано в этой записи блога.
Что важно в PDF-файлах
Adobe Portable Document Format (PDF) стал стандартом для хранения документов в эпоху цифровых технологий. Он стал стандартом главным образом потому, что Adobe приняла гениальное деловое решение бесплатно распространять приложение Adobe Acrobat Reader среди всех, в то время как другие форматы иногда требовали проприетарной технологии для просмотра своих документов. Формат PDF очень сложен и часто используется в качестве оболочки для других форматов изображений. Например, файлы TIFF и JPG можно хранить в оболочке PDF, что делает их согласованными для просмотра. Одна из лучших вещей, которые делает PDF, — это то, что он позволяет хранить несколько страниц для представления одного документа (чего JPG не позволяет). Еще одна очень популярная функция PDF заключается в том, что она позволяет хранить текст документа, а не только изображение, что позволяет выполнять поиск или копирование текста. Сегодня большинство современных сканеров и других современных программных продуктов, таких как Microsoft Office, могут сохранять данные непосредственно в формате PDF, поэтому вам не нужно покупать какие-либо дополнительные продукты для создания файлов PDF.
Не все сканеры одинаковы
Итак, вам нужен сканер, что вы должны купить? Это одна из тех ситуаций, когда «вы получаете то, за что платите». Есть много сканеров на выбор, и большинство из них справятся со своей задачей. Многие многофункциональные принтеры (МФУ) неплохо справляются со сканированием. Вы даже можете отсканировать бумажный документ с помощью своего современного смартфона вместе с приложением для сканирования, см. соответствующий пост в блоге. Однако, если вы профессиональная юридическая фирма и собираетесь сканировать более нескольких страниц в неделю, мы рекомендуем вам подумать о покупке настоящего промышленного сканера, который сэкономит вам много денег и избавит вас от головной боли в долгосрочной перспективе. На этой странице вы можете приобрести производственный сканер, настроенный для работы с MiFILE.
Вы можете изменить разрешение сканирования во всплывающем меню «Разрешение». Более высокое разрешение требует больше памяти и времени на передачу, но дает более четкое отсканированное изображение. В следующей таблице показаны разрешения, которые вы можете выбрать, и доступные цвета.
Тип сканирования
Используйте для фотографических изображений или графики. (Диффузия ошибок — это метод создания смоделированных серых изображений без использования настоящих серых точек. Черные точки размещаются по определенному шаблону, чтобы создать серый вид.)
Используйте для фотографических изображений или графики. Этот режим более точен, поскольку использует до 256 оттенков серого.
Хотя при использовании 24-битного цвета создается изображение с наиболее точной цветопередачей, размер файла изображения будет примерно в три раза больше, чем у файла, созданного с использованием параметра 8-битного цвета. Он требует больше всего памяти и имеет наибольшее время передачи.
Размер документа
Чтобы отсканировать визитные карточки, выберите размер визитной карточки, а затем поместите визитную карточку лицевой стороной вниз в левом верхнем углу стекла сканера, как указано в направляющих документах на устройстве.
После того, как вы выберете нестандартный размер, вы сможете настроить область сканирования. Нажмите и удерживайте кнопку мыши, перетаскивая мышь, чтобы обрезать изображение.
Настройка изображения
Настройте параметр (от -50 до 50), чтобы получить наилучшее изображение. Значение по умолчанию равно 0, что соответствует среднему значению и обычно подходит для большинства изображений.
Вы можете установить уровень яркости, перетащив ползунок вправо или влево, чтобы осветлить или затемнить изображение. Вы также можете ввести значение в поле, чтобы установить уровень.
Настройка «Яркость» доступна только в том случае, если для параметра «Тип сканирования» выбрано значение «Черно-белое», «Серое (рассеивание ошибок)» или «Настоящее серое».
Вы можете увеличить или уменьшить уровень контрастности, перемещая ползунок влево или вправо. При увеличении выделяются темные и светлые участки изображения, при уменьшении — больше деталей в серых областях. Вы также можете ввести значение в поле для настройки контрастности .
Настройка «Контрастность» доступна только в том случае, если для параметра «Тип сканирования» выбрано значение «Серый» (рассеивание ошибок) или «Настоящий серый».
С помощью этого параметра вы можете улучшить и улучшить качество отсканированных изображений. Параметр «Уменьшить шум» доступен при использовании 24-битного цвета и разрешении сканирования 300 × 300 т/д, 400 × 400 т/д или 600 × 600 т/д.
При сканировании фотографий или других изображений для использования в текстовом редакторе или другом графическом приложении попробуйте разные настройки для параметров Разрешение , Тип сканирования , Яркость и Контрастность, чтобы определить, какая настройка лучше всего соответствует вашим потребностям.
Image Capture Plus — это приложение, которое передает данные изображения, отсканированные с помощью высокоскоростного сканера документов Panasonic, на ПК в виде файла изображения, стандартно вложенного в приложение. Пожалуйста, обратитесь к странице Image Capture Plus, чтобы получить более подробную информацию.
Экспресс-пакет Image Capture Plus
Image Caputre Plus Express — это режим сканирования Image Capture Plus с простым и интуитивно понятным управлением. Отсканированные изображения нельзя просматривать и редактировать.
Пожалуйста, обратитесь к странице Image Capture Plus Express, чтобы получить более подробную информацию.
*Image Capture Plus — это приложение, которое передает данные изображения, отсканированные с помощью высокоскоростного сканера документов Panasonic, на ПК в виде файла изображения.
Модель:KV-SL3066 / KV-SL3056 / KV-SL3055 / KV-SL3036 / KV-SL3035 / KV-S8150 / KV-S8147 / KV-S8130 / KV-S8127 / KV-S8120 / KV-S7097 / KV -S7077 / KV-S7075C / KV-S6120 / KV-S6110 / KV-S6100 / KV-S5076H / KV-S5046H / KV-SL5100 / KV-SL5096 / KV-SL5095 / KV-SL5086 / KV-SL5085 / KV-S5055C / KV-S4085CW / KV-S4085CL / KV-S4065CW / KV-S4065CL / KV-S2087 / KV-S1058Y / KV-S1057C MK2 / KV-S1038 / KV-S1037 / KV-S1037X / KV-S1027C MK2 / KV-S1057C / KV-S1027C / KV-S1026C MK2 / KV-SL1066 / KV-SL1056 / KV-SL1055 / KV-SL1036 / KV-SL1035 / KV-SL1077 MK2 / KV-SL1066 MK2 / KV-SL1056 MK2 / KV-SL1055 MK2 / KV-SL1036 MK2 / KV-SL1035 MK2 / KV-S1065C*1 / KV-S1046C*1 / KV-S1045C / KV-S1026C / KV-S1015C / KV-S1025C / KV-S1020C / KV-N1058X / KV-N1058Y / KV-N1028X / KV-N1028Y / KV-S5078Y / KV-S5058 / KV-SL5100 MK2 / KV-SL5096 MK2 / KV-SL5095 MK2 / KV-SL5086 MK2 / KV-SL5085 MK2
*1 Автоматический предварительный просмотр и автоматическое повторное сканирование можно использовать для следующих условий.
- Серийный номер (11 цифр): 7 символ слева — "C" или после него, например xxxxxxCxxxx
- Версия микропрограммы 2.00 или более поздняя
* Если старая версия уже установлена, удалите ее перед установкой последней версии. (драйвер устройства сканера документов Panasonic)
* Имя файла '*_ All_Package' включает ICP, драйвер устройства, UserUtility и MCD Utility.
* Установка программного обеспечения OCREngine после загрузки необходима для обновления функции создания PDF с возможностью поиска, функции PDF с высокой степенью сжатия и функции зоны OCR.
Но для установки загруженного программного обеспечения OCREngine необходимо заранее установить старую версию программного обеспечения OCREngine с компакт-диска или DVD-диска, включая Image Capture Plus.
* При использовании OCREngine версии 2.2 или более поздней версии следующие языки поддерживаются для «PDF с возможностью поиска» и «Zone-OCR».
[польский], [голландский], [датский], [шведский], [португальский]
* При использовании OCREngine вер. 2.9 или более поздней версии следующие языки поддерживаются для «PDF с возможностью поиска» и «Zone-OCR». [Чешский], [хорватский], [венгерский], [румынский], [греческий], [вьетнамский], [тайский]
* При использовании OCREngine вер. 2.11 или более поздней версии следующие языки поддерживаются для «PDF с возможностью поиска» и «Zone-OCR». [Словенский]
* При использовании функции автоматической ориентации изображения для упрощенного китайского, традиционного китайского, корейского, русского, греческого и тайского языков необходимо установить программное обеспечение OCREngine.
* Запустите загруженный файл, после чего сразу же запустится программа установки.
* Название компании, указанное в руководстве по эксплуатации, может отличаться от текущего названия компании из-за изменения названия компании.
Читайте также: