Автор: Пользователь скрыл имя, 10 Мая 2012 в 05:27, контрольная работа
Данная пояснительная записка является приложением к Локальному профилю файловых форматов и дает более подробную информацию о перечисленных в нем спецификациях, а также приводит обоснования их выбора (в т. ч. преимуществ перед значимыми альтернативными реализациями). Пояснительная записка не является частью локального профиля и не устанавливает каких-либо требований или условий по его использованию в рамках АПО. Во избежание дублирования информации в записке не приводятся окончательные решения, изложенные в Локальном профиле, а описываются только исходные данные для анализа и результаты рассмотрения спецификаций по отдельным критериям.
Введение.
Источники
Методика оценки
1 Состав и структура профиля
2 выбор спецификаций
2.1 Общие спецификации
2.1.1 Универсальный формат для представления данных.
2.1.2 Кодировка символов
2.1.3 Форматы агрегирования и компрессии
2.2 Форматы текстовых документов
2.3 Форматы представления двумерных статических изображений
2.3.1 Растровая графика
2.3.2 Векторная графика
2.4 Форматы представления аудиовизуальных произведений и фонограмм
2.5 Прочие форматы
2.5.1 Электронные таблицы, презентации
2.5.2 Анимация и интерактивность
Заключение
Здесь и далее в таблицах используются следующие условные обозначения:
+ - соответствует требованиям, имеет соответствующий показатель;
- - явно не соответствует требованиям (например, текст спецификации содержит прямое отрицание данного требования или условия);
? – информация недоступна или не позволяет вынести окончательное заключение (например, в тексте спецификации нет прямых ограничений на ее использование, однако и не установлен явно ее свободный статус, а практика использования говорит о возможных патентных проблемах);
+/- - частично соответствует требованиям (имеются отдельные положения, которые не вполне удовлетворяют требованию, но не противоречат ему);
* - используется для критериев оценки, рассматриваемых сравнительно (см. раздел 1), указывает на спецификации, имеющие наилучшие показатели по данному критерию по сравнению с прочими рассмотренными.
В следующей таблице приведен сравнительный анализ форматов и их спецификаций по основным критериям.
Наименование | ZIP | GZIP | RAR | CAB | BZIP2 | Примечания |
Полнота | + | +/- | + | + | + | См. описание форматов выше. |
Соответствие содержания | + | +/- | + | +/- | + | |
Ориентация на открытые системы |
| + |
|
| + |
|
Согласованность с принципами АПО | + | + |
|
| + | Форматы RAR и CAB являются частными |
Отсутствие дискриминации и расширения требований | + | + | ? | ? | + | |
Зрелость | * |
|
|
|
| Все рассмотренные форматы являются стабильными и не предполагают существенного развития. |
Современность |
|
|
|
| * | |
Перспективность |
|
|
|
|
| |
Рыночная поддержка | * | * |
|
|
| Формат компрессии GZIP используется в протоколе HTTP |
Практическое использование | * | * |
|
|
| |
Наличие свободных реализаций | + | + | - | - | + |
|
Адаптивность и гибкость | + | - | + |
| + |
|
Как видно из таблицы, ни один из дополнительно рассмотренных форматов компрессии также не удовлетворяет всем требованиям АПО, в связи с чем было принято решение сохранить в Локальном профиле форматы ZIP и GZIP, придав им статус рекомендованных.
Под текстовыми документами в данном разделе понимаются все виды документов без строгой структуры, при этом предполагается, что некоторые документы могут включать также иллюстрации, таблицы, сведения о внешнем оформлении текста, шрифтах и т.п. В разделе выделяются следующие виды документов в зависимости от их основного назначения:
Формат представления документов для последующей обработки (редактирования). Основной формат обмена текстовыми документами, предполагающий возможность использования универсальных текстовых процессоров с развитыми средствами редактирования и форматирования. Должен обеспечивать, как минимум:
o Возможность задания шрифтов, начертаний, стилей основных структурных элементов документа, выравнивания абзацев и иных параметров оформления.
o Возможность представления документа для печати путем задания логических параметров вывода страниц – формата бумаги, взаимного расположения абзацев, колонтитулов и т.п.
o Возможность включения в текст иллюстраций, таблиц, элементов автоматизации (оглавлений, индексов, автонумерации страниц и т.п.).
o Возможность включения в файл метаданных документа.
o Возможность отслеживания и сохранения исправлений.
Независимый от устройства вывода формат для представления документов с сохранением разметки страниц (аппаратно-независимый формат, формат для печати). Должен обеспечивать задание точных физических параметров вывода страниц. Применяется:
o Для документов, которые по юридическим основаниям должны представляться в виде твердой (бумажной) копии, т.е. когда юридически значимым является постраничная разбивка текста и расположение на страницах иных содержательных элементов (иллюстраций, колонтитулов и т.п.), которое не может быть обеспечено средствами формата обработки.
o Для документов, где значимым является точное взаиморасположение (верстка) содержательных элементов, которое невозможно обеспечить средствами формата для обработки (чертежи и схемы, сложные таблицы, руководства пользователей и учебные материалы, макеты книг и т.п.).
В зарубежных источниках для представления текстовых документов указаны следующие форматы:
PDF (Portable Document Format). Разработчиком является компания Adobe[4], в качестве стандарта де-юре принят ISO (ISO 15930-5:2003 - PDF/X-2). Документы в формате PDF имеют одинаковый вид как при печати, так и при отображении на экране мониторов вне зависимости от разрешающей способности (разумеется, при правильной реализации формирующей и отображающей программы). При этом обеспечивается корректное сохранение разметки страниц, взаимного расположения текстовых и графических элементов документа. Документы в формате PDF успешно индексируются поисковыми системами в Интернете. Формат ориентирован преимущественно на предпечатную подготовку документов. Его использование для представления при редактировании документов затруднено (практически невозможно) в связи с тем, что формат оперирует такими низкоуровневыми понятиями, как строка символов, отображаемая тем или иным шрифтом, линия и т.д. в противовес таким понятиям, как абзац, заголовок, колонтитул. Ограничены также возможности по использованию в документах интерактивных и мультимедийных элементов. В связи с этим в дальнейшем данный формат рассматривается только как аппаратно-независимый формат.
HTML различных версий (стандарт W3C). Формат сам по себе не обеспечивает представления документов для печати, однако может использоваться для работы с гипертекстовыми документами, предназначенными исключительно для использования в электронной форме.
Форматы файлов текстового процессора Microsoft Word (.doc). Формат является закрытым, официальные спецификации отсутствуют, легальное использование формата ограничено решениями единственного поставщика. Однако с функциональной точки зрения формат удовлетворяет всем требованиям, предъявленным к формату для обработки, а большое количество унаследованных документов MS Word диктуют необходимость его поддержки в статусе выбывающего.
Rich Text Format (RTF). Разработан фирмой Microsoft как переносимый формат для обмена документами между текстовыми процессорами различных производителей. Спецификация формата доступна[5], но её поддержка и развитие является исключительно в компетенции разработавшей его компании. В связи с этим формат не может быть оценен, как стабильный, кроме того, существует несколько ограниченно совместимых версий формата, что делает его малоприменимым для полноценного обмена информацией. Формат в значительной степени человекочитаем, однако встроенные объекты хранятся в кодировке base64[6]. Поскольку RTF разрабатывался для текстового представления документов Microsoft Word, им унаследовано большое количество особенностей старых версий двоичного формата этого текстового процессора. Формат в настоящее время не развивается, и в целом не может быть оценен, как перспективный и современный. В то же время он широко поддержан рынком и является единственным открытым способом обмена документами с текстовым процессором Microsoft Word.
Сводная оценка соответствия форматов первичным критериям приведена в таблице.
Наименование | RTF | .doc | |
Стабильность | + | - | - |
Доступность | + | + | - |
Отсутствие ограничений | +/- | - | - |
Отсутствие роялти | + | +/- | - |
В связи с тем, что форматы RTF и .doc не удовлетворяют первичным требованиям, формат PDF не может быть использован в качестве основного формата для обработки, а формат HTML – для аппаратно-независимого представления, в список для расширенного рассмотрения был дополнительно включен формат Open Office XML Основан на формате, используемом текстовым процессором из пакета OpenOffice.org[7].
Формат обеспечивает полноценный и традиционный для текстовых процессоров общего назначения (таких как Microsoft Word) набор выразительных средств. Формат полностью открыт, свободен от лицензионных выплат и, кроме того, удобен для обработки в автоматизированных системах, не являющихся текстовыми процессорами и даже не имеющих пользовательского интерфейса.
Файл в этом формате представляет собой набор файлов, запакованных в архив формата ZIP[8]. В архиве находятся несколько XML файлов, описывающих содержание и оформление документов и различные включённые объекты, такие как графические файлы в стандартном формате. Для передачи визуального форматирования используется подмножество атрибутов стандарта XSL-FO, для передачи математических формул - MathML[9], для векторной графики — SVG[10], для связей между частями документа - XLink[11]. Таким образом, формат удовлетворяет общим принципам АПО и совместим с общими спецификациями данного локального профиля (см. предыдущий раздел).
На данный момент доступна одна полная (OpenOffice.org) и несколько частичных реализаций стандарта. Формат оценивается экспертами, как чрезвычайно перспективный, однако недостаточная поддержка рынком не позволяет принять его в качестве единственного основного формата.
Общие результаты расширенного сопоставления рассматриваемых спецификаций приведены в таблицы.
Наименование | RTF | .doc | OO XML | HTML | Примечания | |
Полнота | + | +/- | + | + | + | Формат PDF рассматривался только для аппаратно-независимого представления. |
Соответствие содержания | +/- | +/- | +/- | + | - | |
Ориентация на открытые системы | - | - | - | + | + |
|
Согласованность с принципами АПО | + | - | - | + | + |
|
Отсутствие дискриминации и расширения требований | - | + | - | + | + | |
Зрелость | * |
|
|
| * |
|
Современность |
|
|
| * |
| |
Перспективность |
|
|
| * |
| |
Рыночная поддержка | * |
|
|
| * |
|
Практическое использование |
|
| * |
|
| |
Наличие свободных реализаций | +/- | +/- | - | + | + |
|
Адаптивность и гибкость | - | - | - | + | +/- |
|
С целью обеспечения полноты стека спецификаций в локальный профиль также включены (без расширенного рассмотрения):
Формат гипертекстового документа для использования в веб-приложениях и связанный с ним формат описания визуального представления элементов гипертекстовых документов. Выбор спецификаций для данных задач диктуется общими принципами АПО и Главным профилем АПО, а также требованиями по технологической совместимости с широко используемыми веб-браузерами. Поскольку задача разработки переносимых гипертекстовых документов имеет свою специфику по сравнению с задачей разработки веб-интерфейсов, в профиле предложено наложить определенные ограничения на HTML (см. п. 4.3. Локального профиля).
Поскольку все большее количество распространенных браузеров обеспечивает поддержку XML-представления гипертекстовых документов, в ходе будущего совершенствования АПО в целом и локального профиля в частности, данный раздел предполагается пересмотреть вплоть до полного отказа от использования связки HTML/CSS в пользу XML (в сочетании с тем или иным удовлетворяющим критериям АПО механизмом трансформации для целей представления).
Формат представления сканированных документов без распознавания текста. С технологической точки зрения данный тип данных является разновидностью двумерного статического изображения, в связи с чем для их представления принята удовлетворяющая требованиям назначения спецификация из соответствующего раздела локального профиля (см. ниже), а именно формат TIFF, допускающий многостраничное представление сканированных документов (т.е. размещение нескольких изображений в одном файле-контейнере).
Рассматриваемые источники в точности отражают сложившуюся на рынке ситуацию, когда для различных подзадач представления растровой графики практически монопольно используется один из четырех включенных в каталоги форматов, перечисленных в таблице ниже. Сопоставление функциональных возможностей форматов показывает, что прямая конкуренция возникает только у форматов GIF и PNG – последний был разработан, как замена первому и продвигается в этой роли консорциумом W3C.
В структуре профиля соответственно выделены следующие области применения этих форматов:
Растровые двумерные статические изображений, в т.ч. для интерфейсов веб-приложений.
Фотографии и иные полутоновые изображения, допускающие компрессию с потерей качества.
Растровые изображения в высоком разрешении без потерь качества (в т.ч. для целей предпечатной подготовки).