Автор: Пользователь скрыл имя, 03 Ноября 2012 в 14:17, доклад
Графические форматы различаются по виду хранимых данных (растровая, векторная и смешанная формы), по допустимому объему данных, параметрам изображения, хранению палитры, методике сжатия данных (для EGA без сжатия требуется 256К) - DCLZ (Data Compression Lempel-Ziv), LZW (Lempel-Ziv & Welch), по способам организации файла (текстовый, двоичный), структуре файла (с последовательной или ссылочной (индексно-последовательной) структурой) и т.д.
Растровый файл состоит из точек, число которых определяется разрешением, измеряемым обычно в точках на дюйм (dpi) или на сантиметр (dpc). Очень важным фактором, влияющим, с одной стороны, на качество вывода изображения, а с другой - на размер файла, является глубина цвета, т.е. число разрядов, отводимых для хранения информации о трех составляющих (если это цветная картинка) или одной составляющей (для полутонового не цветного изображения).
Графические форматы
Графические форматы различаются по виду хранимых данных (растровая, векторная и смешанная формы), по допустимому объему данных, параметрам изображения, хранению палитры, методике сжатия данных (для EGA без сжатия требуется 256К) - DCLZ (Data Compression Lempel-Ziv), LZW (Lempel-Ziv & Welch), по способам организации файла (текстовый, двоичный), структуре файла (с последовательной или ссылочной (индексно-последовательной) структурой) и т.д.
Растровый файл состоит из
точек, число которых определяется
разрешением, измеряемым обычно в точках
на дюйм (dpi) или на сантиметр (dpc). Очень
важным фактором, влияющим, с одной
стороны, на качество вывода изображения,
а с другой - на размер файла, является
глубина цвета, т.е. число разрядов,
отводимых для хранения информации
о трех составляющих (если это цветная
картинка) или одной составляющей
(для полутонового не цветного изображения).
Например, при использовании модели
RGB глубина 24 разряда на точку означает,
что на каждый цвет (красный, синий,
зеленый) отводится по 8 разрядов и
поэтому в таком файле может
храниться информация о 2^24 = 16,777,216 цветах
(Обычно в этом случае говорят о 16
млн. цветов). Очевидно, что даже файлы
с низким разрешением содержат в
себе тысячи или десятки тысяч
точек. Так, растровая картинка размером
1024х768 точек и с 256 цветами занимает
768 Кбайт. Для уменьшения объемов
файлов разработаны специальные
алгоритмы сжатия графической информации.
Именно они и являются основной причиной
существования графических
Векторный способ записи графических данных применяется в системах автоматического проектирования (CAD) и в графических пакетах. В этом случае изображение состоит из простейших элементов (линия, ломаная, кривая Безье, эллипс, прямоугольник и т.д.), для каждого из которых определен ряд атрибутов (например, для замкнутого многоугольника - координаты угловых точек, толщина и цвет контурной линии, тип и цвета заливки и т.д.). Записывается также место объектов на странице и расположение их друг относительно друга (какой из них "лежит" выше, а какой ниже). Векторный формат является доказательством идеи древнегреческих математиков о том, что любую существующую в природе форму можно описать, используя геометрические примитивы и компас.
У каждого метода есть свои
преимущества. Растровый позволяет
передавать тонкие, едва уловимые детали
образов, векторный же лучше всего
применять, если оригинал имеет отчетливые
геометрические очертания. Векторные
файла меньше по объему, зато растровые
быстрее вырисовываются на экране дисплея,
так как для вывода векторного
изображения процессору необходимо
произвести множество математических
операций. С другой стороны, векторные
файлы гораздо проще
Существует множество программ-трансляторов, переводящих данные из векторного формата в растровый. Как правило, такая задача решается довольно просто, чего нельзя сказать об обратной операции - преобразовании растрового файла в векторный и даже о переводе одного векторного файла в другой. Векторные алгоритмы записи используют уникальные для каждой фирмы-поставщика математические модели, описывающие элементы изображения.
Ниже описан ряд наиболее распространенных графических форматов.
1. PCX - Простейший растровый формат. Первоначально этот формат использовался в программе PaintBrush фирмы Zsoft, однако в последствии получил широкое распространение среди пакетов редактирования растровых изображений, хотя до сих пор не признан в качестве официального стандарта. К сожалению, в процессе своей эволюции PCX претерпел настолько значительные изменения, что современная версия формата, поддерживающая 24-разрядный цветовой режим, не может использоваться старыми программами. С самого "рождения" формат PCX был ориентирован на существующие видеоадаптеры (сначала EGA, потом VGA) и поэтому является аппаратно-зависимым. В PCX используется схема сжатия данных RLE, позволяющая уменьшать размер файла, например, на 40- 70%, если используется 16 и менее цветов, и на 10- 30% для 256-цветных изображений.
2. BMP - (Windows Bitmap) разрабатывался фирмой Microsoft как совместимый со всеми приложениями Windows. Для приложений в операционной системе OS/2 имеется собственная версия BMP. В формате BMP можно сохранять черно-белые, серые полутоновые, индексные цветные и цветные изображения системы RGB (но не двухцветные или цветные изображения системы CMYK). Недостаток этих графических форматов: большой объем. Следствие - малая пригодность для Internet-публикаций.
3. GIF - поддерживает до 256 цветов, позволяет задавать один из цветов как прозрачный, дает возможность сохранения с чередованием строк (при просмотре сначала выводится каждая 8-я, затем каждая 4-я и т.д. Это позволяет судить об изображении до его полной загрузки). Способен содержать несколько кадров в одном файле с последующей последовательной демонстрацией (т.н. "анимированный GIF"). Уменьшение размера файла достигается удалением из описания палитры неиспользуемых цветов и построчного сжатия данных (записывается количество точек повторяющегося по горизонтали цвета, а не каждая точка с указанием ее цвета). Такой алгоритм дает лучшие результаты для изображений с протяженными по горизонтали однотонными объектами. Для сжатия файла используется высокоэффективный алгоритм Лемпела - Зива - Велча (LZW)
4. TIFF (target image file format) - был разработан специально для использования в приложениях, связанных с компоновкой страницы и направлен на преодоление трудностей, которые возникают при переносе графических файлов с IBM-совместимых компьютеров на Macintosh и обратно. Он поддерживается всеми основными графическими пакетами и пакетами редактирования изображений и читается на многих платформах. Использует сжатие изображения (LZW). Формат TIFF очень удобен, но за это приходится расплачиваться огромными размерами получаемых файлов (например, файл формата А4 в цветовой модели CMYK с разрешением 300 dpi, обычно применяемым для высококачественной печати, имеет размер около 40 Мбайт). Кроме того, существует несколько "диалектов" формата, которые не каждая программа, поддерживающая TIFF, легко "понимает".
5. JPEG - миллионы цветов и оттенков, палитра не настраиваемая, предназначен для представления сложных фотоизображений. Разновидность progressive JPEG позволяет сохранять изображения с выводом за указанное количество шагов (от 3 до 5 в Photoshop'e) - сначала с маленьким разрешением (плохим качеством), на следующих этапах первичное изображение перерисовывается все более качественной картинкой. Анимация или прозрачный цвет форматом не поддерживаются. Уменьшение размера файла достигается сложным математическим алгоритмом удаления информации - чем заказываемое качество ниже, тем коэффициент сжатия больше, файл меньше. Главное, подобрать максимальное сжатие при минимальной потере качества. Последний идентифицирует и отбрасывает данные, которые человеческий глаз не в состоянии увидеть (незначительные изменения в цвете не различаются человеком, тогда как улавливается даже малейшая разница в интенсивности, поэтому JPEG меньше подходит для обработки черно-белых полутоновых изображений), что приводит к существенному уменьшению размера файла. Таким образом, в отличие от метода сжатия LZW или RLE в результате применения технологии JPEG данные теряются навсегда. Так, файл, однажды записанный в формате JPEG, а затем переведенный, скажем, в TIFF, уже не будет тем же, что и оригинал. Наиболее подходящий формат для размещения в Интернете полноцветных изображений. Вероятно, до появления мощных алгоритмов сжатия изображения без потери качества останется ведущим форматом для представления фотографий в Web.
6. PNG - пока малораспространен из-за слабой рекламы, создавался специально для Интернета как замена первых двух форматов и благодаря патентной политике Compuserve постепенно вытесняет GIF (см. выше). Позволяет выбирать палитру сохранения - серые полутона, 256 цветов, true color ("истинные цвета"). В зависимости от свойств изображения действительно иногда предпочтительнее GIF'a или JPG'a. Позволяет использовать "прозрачный" цвет, но, в отличие от GIF'a таких цветов может быть до 256. В отличие от GIF сжатие без потери качества производится и по горизонтали и по вертикали (алгоритм собственный, параметры тоже не настраиваемые). Не умеет создавать анимированные ролики (разрабатывается формат MNG).
7. PDF (Portable Document Format) - это пример смешанного формата, предназначенного для хранения текста и графики одновременно. В формате PDF сохраняются данные текстовым редактором Adobe Acrobat. Для сжатия графики применяется метод LZW.
8. PSD - формат графического редактора Adobe Photoshop. Обладает очень большими возможностями. Хранит данные о различных палитрах цветов, о прозрачности, имеет возможность хранения послойных изображений. При этом отличается большим размером.
В настоящее время
Как сейчас решается вопрос с переводом информации из бумажного вида в электронный? Понятно, что первым делом книга, журнал, газета, не суть важно что - сканируется. Что можно сделать потом? Очевидно, дальше имеет смысл распознать отсканированный текст. Конечно, это самое грамотное решение, позволяющее использовать все преимущества цифрового представления информации. Основная проблема в этом случае заключается в том, что невозможно поставить распознавание на поток. Распознавание большого количества материалов - крайне трудоемкий процесс.
Поэтому для перевода в
цифру большого количества материалов,
как правило, их просто сохраняют
в виде картинки. Но и тут есть
целый ряд трудностей. Дело в том,
что сейчас распространены только два
компрессирующих формата
При этом у двух существующих компрессирующих форматов существуют серьезные недостатки. GIF, к примеру, не может содержать больше 256 цветов. Для текста, конечно, этого более чем достаточно, но что делать, если на странице напечатаны красивые цветные фотографии? Для представления фотографий обычно используют формат JPEG, и свои задачи, в подавляющем большинстве случаев, он реализует "на ура". Но в то же время, сохранять в JPEG текст или, скажем, чертежи (lineart) - полнейший абсурд: JPEG "размоет" и испортит их. Разделять же представляемую информацию на разные форматы не менее трудоемко, чем распознавать тексты, но при этом еще и страшно неудобно в дальнейшем использовании.
Очевидно, что идеальным
выходом из сложившейся ситуации
стало бы либо появление крайне умных
систем распознавания, не делающих ошибок,
либо создание нового графического формата,
умеющего компрессировать и
Оказывается, такой формат уже придуман. При чем придуман по умному, хотя и не без недочетов. Называется он DjVu ("дежа вю"). Работает примерно следующим образом. Сначала выделяет на странице весь текст и lineart, после чего отдельно отображает картинки. При чем и то и другое - качественно. Да и объем файла, представляющего обычную страницу A4 с текстом и фотографиями в разрешении 300 DPI получается примерно 45-50 килобайт, что, по последним исследованиям, равно усредненному весу web-странички.
Для того чтобы иметь возможность
просматривать подобные картинки, необходимо
установить специальный plug-in, который
весит немногим меньше девятисот
килобайт. При этом сделан он очень
интересно. Дело в том, что, в отличие
от обычных программ-
Технология сжатия файлов изображений DjVu
В настоящее время бурное развитие телекоммуникационных сетей, в том числе и Интернета, выдвигает большие требования к скорости сжатия и декомпрессии, а также к размерам передаваемых файлов изображений. Не всегда имеющиеся на сегодняшний день технологии удовлетворяют этим требованиям, вследствие чего возникают сложности с использованием изображений в реальном времени.
В этой статье речь пойдет о DjVu - новейшей технологии сжатия файлов изображений от компании LizardTech, возможности которой на порядки выше возможностей существующих технологий.
Компания LizardTech приобрела эту разработку у AT&T Labs и затем доработала ее до состояния, пригодного к продаже, в виде компьютерной программы для корпораций и частных лиц.
Рассмотрим сначала назначение и основные достоинства DjVu.
DjVu - технология, преобразующая
отсканированные документы (
Следует отметить, что технология
DjVu прежде всего ориентирована на
различные документы, содержащие смешанную
информацию - в основном текстовую
и графические изображения. Для
представления и преобразования
сложных графических
Новая технология DjVu сжимает
файлы изображений до рекордно малых
размеров без потери четкости и разрешения
изображения. Так, если отсканировать
цветные документы с