Обьем документа

Автор: Пользователь скрыл имя, 10 Мая 2012 в 05:27, контрольная работа

Краткое описание

Данная пояснительная записка является приложением к Локальному профилю файловых форматов и дает более подробную информацию о перечисленных в нем спецификациях, а также приводит обоснования их выбора (в т. ч. преимуществ перед значимыми альтернативными реализациями). Пояснительная записка не является частью локального профиля и не устанавливает каких-либо требований или условий по его использованию в рамках АПО. Во избежание дублирования информации в записке не приводятся окончательные решения, изложенные в Локальном профиле, а описываются только исходные данные для анализа и результаты рассмотрения спецификаций по отдельным критериям.

Оглавление

Введение.
Источники
Методика оценки
1 Состав и структура профиля
2 выбор спецификаций
2.1 Общие спецификации
2.1.1 Универсальный формат для представления данных.
2.1.2 Кодировка символов
2.1.3 Форматы агрегирования и компрессии
2.2 Форматы текстовых документов
2.3 Форматы представления двумерных статических изображений
2.3.1 Растровая графика
2.3.2 Векторная графика
2.4 Форматы представления аудиовизуальных произведений и фонограмм
2.5 Прочие форматы
2.5.1 Электронные таблицы, презентации
2.5.2 Анимация и интерактивность
Заключение

Файлы: 1 файл

Реферат объем документа.doc

— 395.50 Кб (Скачать)

Здесь и далее в таблицах используются следующие условные обозначения:

+ - соответствует требованиям, имеет соответствующий показатель;

- -  явно не соответствует требованиям (например, текст спецификации содержит прямое отрицание данного требования или условия);

? – информация недоступна или не позволяет вынести окончательное заключение (например, в тексте спецификации нет прямых ограничений на ее использование, однако и не установлен явно ее свободный статус, а практика использования говорит о возможных патентных проблемах);

+/- - частично соответствует требованиям (имеются отдельные положения, которые не вполне удовлетворяют требованию, но не противоречат ему);

* - используется для критериев оценки, рассматриваемых сравнительно (см. раздел 1), указывает на спецификации, имеющие наилучшие показатели по данному критерию по сравнению с прочими рассмотренными.

В следующей таблице приведен сравнительный анализ форматов и их спецификаций по основным критериям.

Наименование

ZIP

GZIP

RAR

CAB

BZIP2

Примечания

Полнота

+

+/-

+

+

+

См. описание форматов выше.

Соответствие содержания

+

+/-

+

+/-

+

Ориентация на открытые системы

 

+

 

 

+

 

Согласованность с принципами АПО

+

+

 

 

+

Форматы RAR и CAB являются частными

Отсутствие дискриминации и расширения требований

+

+

?

?

+

Зрелость

*

 

 

 

 

Все рассмотренные форматы являются стабильными и не предполагают существенного развития.

Современность

 

 

 

 

*

Перспективность

 

 

 

 

 

Рыночная поддержка

*

*

 

 

 

Формат компрессии GZIP используется в протоколе HTTP

Практическое использование

*

*

 

 

 

Наличие свободных реализаций

+

+

-

-

+

 

Адаптивность и гибкость

+

-

+

 

+

 

Как видно из таблицы, ни один из дополнительно рассмотренных форматов компрессии также не удовлетворяет всем требованиям АПО, в связи с чем было принято решение сохранить в Локальном профиле форматы ZIP и GZIP, придав им статус рекомендованных.

2.2 Форматы текстовых документов

Под текстовыми документами в данном разделе понимаются все виды документов без строгой структуры, при этом предполагается, что некоторые документы могут включать также иллюстрации, таблицы, сведения о внешнем оформлении текста, шрифтах и т.п. В разделе выделяются следующие виды документов в зависимости от их основного назначения:

­         Формат представления документов для последующей обработки (редактирования). Основной формат обмена текстовыми документами, предполагающий возможность использования универсальных текстовых процессоров с развитыми средствами редактирования и форматирования. Должен обеспечивать, как минимум:

o        Возможность задания шрифтов, начертаний, стилей основных структурных элементов документа, выравнивания абзацев и иных параметров оформления.

o        Возможность представления документа для печати путем задания логических параметров вывода страниц – формата бумаги, взаимного расположения абзацев, колонтитулов и т.п.

o        Возможность включения в текст иллюстраций, таблиц, элементов автоматизации (оглавлений, индексов, автонумерации страниц и т.п.).

o        Возможность включения в файл метаданных документа.

o        Возможность отслеживания и сохранения исправлений.

­         Независимый от устройства вывода формат для представления документов с сохранением разметки страниц (аппаратно-независимый формат, формат для печати). Должен обеспечивать задание точных физических параметров вывода страниц. Применяется:

o        Для документов, которые по юридическим основаниям должны представляться в виде твердой (бумажной) копии, т.е. когда юридически значимым является постраничная разбивка текста и расположение на страницах иных содержательных элементов (иллюстраций, колонтитулов и т.п.), которое не может быть обеспечено средствами формата обработки.

o        Для документов, где значимым является точное взаиморасположение (верстка) содержательных элементов, которое невозможно обеспечить средствами формата для обработки (чертежи и схемы, сложные таблицы, руководства пользователей и учебные материалы, макеты книг и т.п.).

В зарубежных источниках для представления текстовых документов указаны следующие форматы:

­         PDF (Portable Document Format). Разработчиком является компания Adobe[4], в качестве стандарта де-юре принят ISO (ISO 15930-5:2003 - PDF/X-2). Документы в формате PDF имеют одинаковый вид как при печати, так и при отображении на экране мониторов вне зависимости от разрешающей способности (разумеется, при правильной реализации формирующей и отображающей программы). При этом обеспечивается корректное сохранение разметки страниц, взаимного расположения текстовых и графических элементов документа. Документы в формате PDF успешно индексируются поисковыми системами в Интернете. Формат ориентирован преимущественно на предпечатную подготовку документов. Его использование для представления при редактировании документов затруднено (практически невозможно) в связи с тем, что формат оперирует такими низкоуровневыми понятиями, как строка символов, отображаемая тем или иным шрифтом, линия и т.д. в противовес таким понятиям, как абзац, заголовок, колонтитул. Ограничены также возможности по использованию в документах интерактивных и мультимедийных элементов. В связи с этим в дальнейшем данный формат рассматривается только как аппаратно-независимый формат.

­         HTML различных версий (стандарт W3C). Формат сам по себе не обеспечивает представления документов для печати, однако может использоваться для работы с гипертекстовыми документами, предназначенными исключительно для использования в электронной форме.

­         Форматы файлов текстового процессора Microsoft Word (.doc). Формат является закрытым, официальные спецификации отсутствуют, легальное использование формата ограничено решениями единственного поставщика. Однако с функциональной точки зрения формат удовлетворяет всем требованиям, предъявленным к формату для обработки, а большое количество унаследованных документов MS Word диктуют необходимость его поддержки в статусе выбывающего.

­         Rich Text Format (RTF). Разработан фирмой Microsoft как переносимый формат для обмена документами между текстовыми процессорами различных производителей. Спецификация формата доступна[5], но её поддержка и развитие является исключительно в компетенции разработавшей его компании. В связи с этим формат не может быть оценен, как стабильный, кроме того, существует несколько ограниченно совместимых версий формата, что делает его малоприменимым для полноценного обмена информацией. Формат в значительной степени человекочитаем, однако встроенные объекты хранятся в кодировке base64[6]. Поскольку RTF разрабатывался для текстового представления документов Microsoft Word, им унаследовано большое количество особенностей старых версий двоичного формата этого текстового процессора. Формат в настоящее время не развивается, и в целом не может быть оценен, как перспективный и современный. В то же время он широко поддержан рынком и является единственным открытым способом обмена документами с текстовым процессором Microsoft Word.

Сводная оценка соответствия форматов первичным критериям приведена в таблице.

Наименование

PDF

RTF

.doc

Стабильность

+

-

-

Доступность

+

+

-

Отсутствие ограничений

+/-

-

-

Отсутствие роялти

+

+/-

-


В связи с тем, что форматы RTF и .doc не удовлетворяют первичным требованиям, формат PDF не может быть использован в качестве основного формата для обработки, а формат HTML – для аппаратно-независимого представления, в список для расширенного рассмотрения был дополнительно включен формат Open Office XML Основан на формате, используемом текстовым процессором из пакета OpenOffice.org[7].

Формат обеспечивает полноценный  и традиционный для текстовых процессоров общего назначения (таких как Microsoft  Word) набор выразительных средств. Формат полностью открыт, свободен от лицензионных выплат и, кроме того, удобен для обработки в автоматизированных системах, не являющихся текстовыми процессорами и даже не имеющих пользовательского интерфейса.

Файл в этом формате представляет собой набор файлов, запакованных в архив формата ZIP[8]. В архиве находятся несколько XML файлов, описывающих содержание и оформление документов и различные включённые объекты, такие как графические файлы в стандартном формате. Для передачи визуального форматирования используется подмножество атрибутов стандарта XSL-FO, для передачи математических формул - MathML[9], для векторной графики — SVG[10], для связей между частями документа - XLink[11]. Таким образом, формат удовлетворяет общим принципам АПО и совместим с общими спецификациями данного локального профиля (см. предыдущий раздел).

На данный момент доступна одна полная (OpenOffice.org) и несколько частичных реализаций стандарта. Формат оценивается экспертами, как чрезвычайно перспективный, однако недостаточная поддержка рынком не позволяет принять его в качестве единственного основного формата.

Общие результаты расширенного сопоставления рассматриваемых спецификаций приведены в таблицы.

Наименование

PDF

RTF

.doc

OO XML

HTML

Примечания

Полнота

+

+/-

+

+

+

Формат PDF рассматривался только для аппаратно-независимого представления.

Соответствие содержания

+/-

+/-

+/-

+

-

Ориентация на открытые системы

-

-

-

+

+

 

Согласованность с принципами АПО

+

-

-

+

+

 

Отсутствие дискриминации и расширения требований

-

+

-

+

+

Зрелость

*

 

 

 

*

 

Современность

 

 

 

*

 

Перспективность

 

 

 

*

 

Рыночная поддержка

*

 

 

 

*

 

Практическое использование

 

 

*

 

 

Наличие свободных реализаций

+/-

+/-

-

+

+

 

Адаптивность и гибкость

-

-

-

+

+/-

 

С целью обеспечения полноты стека спецификаций в локальный профиль также включены (без расширенного рассмотрения):

­          Формат гипертекстового документа для использования в веб-приложениях и связанный с ним формат описания визуального представления элементов гипертекстовых документов. Выбор спецификаций для данных задач диктуется общими принципами АПО и Главным профилем АПО, а также требованиями по технологической совместимости с широко используемыми веб-браузерами. Поскольку задача разработки переносимых гипертекстовых документов имеет свою специфику по сравнению с задачей разработки веб-интерфейсов, в профиле предложено наложить определенные ограничения на HTML (см. п. 4.3. Локального профиля).

Поскольку все большее количество распространенных браузеров обеспечивает поддержку XML-представления гипертекстовых документов, в ходе будущего совершенствования АПО в целом и локального профиля в частности, данный раздел предполагается пересмотреть вплоть до полного отказа от использования связки HTML/CSS в пользу XML (в сочетании с тем или иным удовлетворяющим критериям АПО механизмом трансформации для целей представления).

­          Формат представления сканированных документов без распознавания текста. С технологической точки зрения данный тип данных является разновидностью двумерного статического изображения, в связи с чем для их представления принята удовлетворяющая требованиям назначения спецификация из соответствующего раздела локального профиля (см. ниже), а именно формат TIFF, допускающий многостраничное представление сканированных документов (т.е. размещение нескольких изображений в одном файле-контейнере).

2.3 Форматы представления двумерных статических изображений

2.3.1 Растровая графика

Рассматриваемые источники в точности отражают сложившуюся на рынке ситуацию, когда для различных подзадач представления растровой графики практически монопольно используется один из четырех включенных в каталоги форматов, перечисленных в таблице ниже. Сопоставление функциональных возможностей форматов показывает, что прямая конкуренция возникает только у форматов GIF и PNG – последний был разработан, как замена первому и продвигается в этой роли консорциумом W3C.

В структуре профиля соответственно выделены следующие области применения этих форматов:

­          Растровые двумерные статические изображений, в т.ч. для интерфейсов веб-приложений.

­          Фотографии и иные полутоновые изображения, допускающие компрессию с потерей качества.

­          Растровые изображения в высоком разрешении без потерь качества (в т.ч. для целей предпечатной подготовки).

Информация о работе Обьем документа