Автор: Пользователь скрыл имя, 10 Мая 2012 в 05:27, контрольная работа
Данная пояснительная записка является приложением к Локальному профилю файловых форматов и дает более подробную информацию о перечисленных в нем спецификациях, а также приводит обоснования их выбора (в т. ч. преимуществ перед значимыми альтернативными реализациями). Пояснительная записка не является частью локального профиля и не устанавливает каких-либо требований или условий по его использованию в рамках АПО. Во избежание дублирования информации в записке не приводятся окончательные решения, изложенные в Локальном профиле, а описываются только исходные данные для анализа и результаты рассмотрения спецификаций по отдельным критериям.
Введение.
Источники
Методика оценки
1 Состав и структура профиля
2 выбор спецификаций
2.1 Общие спецификации
2.1.1 Универсальный формат для представления данных.
2.1.2 Кодировка символов
2.1.3 Форматы агрегирования и компрессии
2.2 Форматы текстовых документов
2.3 Форматы представления двумерных статических изображений
2.3.1 Растровая графика
2.3.2 Векторная графика
2.4 Форматы представления аудиовизуальных произведений и фонограмм
2.5 Прочие форматы
2.5.1 Электронные таблицы, презентации
2.5.2 Анимация и интерактивность
Заключение
Помимо перечисленных в вышеприведенной таблице спецификаций, в рассмотрение был включен также ряд перспективных стандартов, выбранных экспертным путем их числа принятых для данной предметной области какой-либо из основных стандартизирующих организаций, определенных в приложении Б Главного профиля АПО. Как правило, дополнительные спецификации включались в рассмотрение в тех случаях, когда имеющихся в первичном списке спецификаций оказывалось явно недостаточно для покрытия предметной области профиля или они не в полной мере удовлетворяли предъявляемым к ним требованиям (см. ниже). Необходимость рассмотрения дополнительных спецификаций обосновывается в записке ниже в соответствующих разделах.
Оценка спецификаций в соответствии с Регламентом осуществлялась в два этапа – по первичным требованиям открытости и по расширенным критериям (описание критериев см. в Регламенте). В некоторых случаях по усмотрению экспертов, а именно при отсутствии хороших альтернатив или при необходимости поддержки формата унаследованных систем, к расширенному рассмотрению принимались и спецификации, не в полной мере удовлетворяющие первичным требованиям по открытости АПО.
При окончательном отборе спецификаций для включения в профиль предпочтение отдавалось спецификации, набравшей наибольшее число плюсов по расширенным критериям, если только не обнаруживалось какого-либо блокирующего недостатка, делающего ее использование невозможным (как правило, по критерию полноты и соответствия). В том случае, если спецификация не в полной мере удовлетворяла требованиям по открытости, она включалась в Локальный профиль со статусом «выбывающей» или «рекомендованной».
Расширенная экспертиза соответствия выбранных спецификаций критериям АПО не проводилась в следующих случаях:
- если необходимость применения данной спецификации прямо вытекает из требований АПО в целом и каталога спецификаций Главного профиля АПО в частности;
- если спецификация, включенная в каталоги SAGA и TSC, удовлетворяет первичным требованиям, в достаточной степени покрывает предметную область локального профиля и не имеет очевидных альтернатив;
- если функция (задача) профиля АПО, для которой выбирается спецификация, оказывается технологически зависимой от решений, принятых ранее для более важных или высокоуровневых задач профиля; так, например, с учетом того, что для информатизации офисной деятельности в настоящее время применяются в основном интегрированные пакеты программ, выбор определенного формата для текстовых документов общего назначения делает целесообразным использование аналогичных технологий для представления электронных таблиц, презентаций и др.
Все перечисленные случаи особо оговорены далее при рассмотрении соответствующих разделов профиля.
Для рассматриваемой задачи в АПО отсутствует эталонная функциональная модель, в связи с чем структура каталога спецификаций в профиле построена на основе экспертных оценок. Профиль предназначен на определение стека стандартизованных решений для задач повседневного информационного обмена, в основном в рамках документарного обеспечения управления, а также при представлении исполнителями результатов работ по госконтрактам, различной отчетности и т.п. Профиль не предполагается распространять на форматы файлового представления специальных видов данных (картографических, биометрических и т.п.), как правило, бинарных, для которых использование универсального представления на метаязыке неэффективно. Определение спецификаций для представления таких данных должно быть выполнено в рамках локальных профилей, описывающих стек стандартизованных решений соответствующих прикладных задач.
В профиле предлагается выделить следующие группы стандартизируемых спецификаций:
- Общие спецификации. Раздел включает перечень спецификаций и форматов для представления структурированных данных на универсальном метаязыке, устанавливает требования к кодировке текстовых данных и способы сжатия и агрегации файлов.
- Форматы текстовых документов (включая текстовые документы с визуальной разметкой и форматированием, содержащие иллюстрации и иные отличные от текста вставные материалы).
- Форматы представления двумерных статических изображений (растровых и векторных).
- Форматы представления аудиовизуальных произведений и фонограмм (мультимедийные форматы).
- Прочие форматы, не подпадающие под определения предыдущих групп.
Выбор универсального формата представления данных диктуется общими принципами, положенными в основу Архитектуры программного обеспечения электронного государства и устанавливающими XML в качестве метаязыка для межсистемного взаимодействия.
Универсальный формат представления данных должен использоваться во всех системах, предусматривающих обмен файлами, если только для передаваемых данных в профиле для них не предусмотрен специфический формат, и если они не подпадают под категорию специальных данных, форматы которых должны определяться в других профилях. При этом предполагается, что при выборе специальных форматов предпочтение также по возможности будет отдаваться стандартизованным спецификациям на основе XML.
Конкретные схемы данных в XML-файлах должны определяться разработчиками соответствующих систем исходя из практических потребностей, однако общим требованием при этом является обязательное документирование разработанных форматов с помощью формального языка описания схем, также основанного на XML. Помимо формального описания XML Schema разработчик в проектной документации должен раскрывать и семантическую составляющую разработанного формата (смысл всех полей, атрибутов и параметров) в объеме, достаточном для независимой интерпретации и обработки представленных в файле данных.
Допустимая кодировка текстовых символов определяется в Главном профиле АПО и в Локальном профиле файловых форматов приводится в основном в справочных целях, а также для того, чтобы обеспечить полноту предложенного стека спецификаций до момента официального принятия Главного профиля АПО.
Выбор UNICODE диктуется необходимостью поддержки многоязыкового представления документов и устранения противоречий в многочисленных несовместимых кодировках кириллицы, установленных в ГОСТ и используемых на различных платформах. Восьмибитовое представление UTF-8 выбрано с учетом ее фактической распространенности и поддержки рынком. Выбранная кодировка принята в качестве стандарта ISO и удовлетворяет всем требованиям открытости.
Данная группа спецификаций предназначена для решения следующих задач:
1. Агрегирования не связанных между собою файлов, т.е. представления их в виде файла, который может храниться и пересылаться по сетям связи в виде единого целого, а при необходимости из него могут быть извлечены исходные файлы (все или по отдельности), в т.ч. с сохранением их взаимного расположения в рамках файловой системы (в структуре папок/каталогов). Отметим, что данная задача не выделена четко в каталогах SAGA и eGIF TSC, хотя спецификации, обеспечивающие ее решение, косвенно упомянуты.
2. Компрессии (сжатия) данных. В настоящее время в связи с резким снижением стоимости хранения данных на машинных носителей, а также в связи с распространением специализированных алгоритмов компрессии для мультимедийной информации, задача универсальной файловой компрессии сохраняет актуальность главным образом при пересылке данных по сетям связи. Технологически задача компрессии обычно тесно связана с агрегированием, на практике многие (но не все) представленные на рынке форматы позволяют решать обе задачи одновременно.
В качестве форматов агрегации рассматривались две спецификации, удовлетворяющие требованиям по открытости, зрелости и распространенности:
- Образ файловой системы ISO 9660:1988. Изначально создавался как формат файловой системы для оптических носителей, но может быть использован и в других областях. Формат накладывает довольно существенные ограничения на структуру агрегируемой файловой системы в области длины имён файлов и каталогов, а также используемого набора символов. Возможности сохранения в этом формате различных атрибутов файлов также ограничены. Для преодоления этих ограничений используются различные расширения, так в операционных системах компании Microsoft обычно используется расширение Joilet а в POSIX-совместимых операционных системах – расширение Rock Ridge. Однако в связи с тем, что статус первой спецификации четко не определен, а вторая недостаточно поддержана на уровне настольных платформ, использование расширений рекомендуется только в качестве дополнения к основному стандарту, в обоснованных случаях по усмотрению госзаказчиков. Порядок использования расширений предполагается уточнить в последующих версиях профиля.
- Tape Archive (TAR). Входит в стандарт POSIX.1-2001. Формат удовлетворяет всем требованиям к открытости и имеет достаточно широкое распространение (особенно в POSIX-совместимых операционных системах). Имеется значительное число реализаций. Будучи первоначально разработан для агрегации файлов при записи на магнитную ленту, формат недостаточно эффективно обеспечивает прямой доступ к объединённым файлам, что, однако, не препятствует его использованию в целях, предусмотренных профилем.
Сопоставление форматов по расширенным критериям не проводилось, так как области применения указанных спецификаций не полностью пересекаются. Исходя из функциональных возможностей форматов, предложено включить их в профиль оба в статусе рекомендованных.
В качестве основных форматов компрессии на основании зарубежного опыта рассматривались следующие спецификации:
- ZIP. Формат не описан официально ни одной из организаций, занимающихся стандартизацией, но имеет чрезвычайно широкое применение в самых различных областях. Описание формата доступно на сайте компании PkWare[1] и не меняется в течении длительного времени. Использование этого формата свободно от выплат. Формат ZIP используется в таких стандартах как Open Document, J2SE и многих других. Имеются многочисленные реализации, обладающие высочайшей совместимостью.
- Gzip. Также как и ZIP, не относится к официально принятым стандартам, но имеет широчайшее распространение, в частности при передаче файлов по протоколу http. Так, все распространённые веб-браузеры умеют производить декомпрессию этого формата. В отличие от ZIP не является форматом агрегации, но лишь форматом компрессии. При необходимости, агрегация может быть выполнена отдельно, например, в формате TAR. Спецификация формата доступна[2], формат удовлетворяет всем условиям открытости.
Поскольку ни один из указанных форматов не удовлетворяет требованиям АПО по открытости в полной мере (отсутствуют их официально опубликованные стабильные спецификации), были рассмотрены также другие представленные на рынке и практически используемые в России форматы компрессии:
- RAR. Файлы, создаваемые одноимённой программой, разработанной компанией RARSoft[3]. Довольно широко распространены, особенно на территории бывшего СССР. Главным положительным свойством является высокая степень компрессии. Тем не менее, в связи с закрытостью формата RAR, он не может быть рекомендован для использования в системах, разрабатываемых в рамках электронного государства.
- Microsoft Cabinet (CAB). Формат cab широко используется в последних версиях программного обеспечения компании Microsoft. Спецификация формата доступна, но, несмотря на это, существует только одна полноценная реализация. Вне своей ниши (распространение программного обеспечения в среде Microsoft Windows) формат практически не используется.
- Bzip2. Является форматом компрессии, функционально сходным с Gzip, но, как правило, обеспечивающим большую степень сжатия. Удовлетворяет требованиям открытости, но из-за гораздо меньшей степени распространения и поддержки рынком не может быть рекомендован для использования в рамках электронного государства.
Ниже представлена сводная таблица оценки рассмотренных форматов по первичным критериям соответствия требованиям АПО.
Наименование | ZIP | GZIP | RAR | CAB | BZIP2 |
Стабильность | +/- | +/- | ? | + | + |
Доступность | + | + | - | + | + |
Отсутствие ограничений | +/- | + | ? | ? | + |
Отсутствие роялти | + | + | ? | ? | + |