Архивация данных

Автор: Пользователь скрыл имя, 12 Февраля 2013 в 13:51, контрольная работа

Краткое описание

Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации

Файлы: 1 файл

АРХИВАЦИЯ ДАННЫХ.docx

— 23.76 Кб (Скачать)

АРХИВАЦИЯ ДАННЫХ

Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для  архивации, упаковки файлов путем сжатия хранимой в них информации.

Сжатие информации — это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.

Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них  постоянных битов или представления  повторяющихся символов или повторяющейся  последовательности символов в виде коэффициента повторения и соответствующих  символов. Применяются различные  алгоритмы подобного сжатия информации.

Сжиматься могут как один, так и несколько файлов, которые  в сжатом виде помещаются в так  называемый архивный файл или архив.

Архивный файл — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

Целью упаковки файлов обычно являются обеспечение более компактного  размещения информации на диске, сокращение времени и соответственно стоимости  передачи информации по каналам связи  в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос  с одного компьютера на другой, сокращает  время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения  компьютерными вирусами.

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических  образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей — 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Архивация (упаковка) — помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде. Разархивация (распаковка) — процесс восстановления файлов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память;

Архиваторы - это программы, позволяющие создавать и обрабатывать архивные копии файлов. При этом архивные копии имеют меньший размер, чем оригиналы. С помощью специальных алгоритмов сжатия из файлов удаляется вся избыточная информация, а при применении обратных алгоритмов распаковки архивная копия восстанавливается в первоначальном виде.

Программы-архиваторы позволяют  создавать и такие архивы, для  извлечения из которых содержащихся в них файлов не требуются какие-либо программы, так как сами архивные файлы могут содержать программу  распаковки. Такие архивные файлы  называются самораспаковывающимися.

Самораспаковывающийся архивный файл — это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.

Самораспаковывающийся архив  получил название SFX-архив (SelF-eXtracting). Архивы такого типа в MS DOS обычно создаются в форме .ЕХЕ-файла.

Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными. Том — это составная часть многотомного архива. Создавая архив из нескольких частей, можно записать его части на несколько дискет.

Сжатие информации - проблема, имеющая достаточно давнюю историю, гораздо более давнюю, нежели история  развития вычислительной техники, которая (история) обычно шла параллельно  с историей развития проблемы кодирования  и шифровки информации.

Все алгоритмы сжатия оперируют  входным потоком информации, минимальной  единицей которой является бит, а максимальной - несколько бит, байт или несколько байт.

Целью процесса сжатия, как  правило, есть получение более компактного  выходного потока информационных единиц из некоторого изначально некомпактного  входного потока при помощи некоторого их преобразования.

Основными техническими характеристиками процессов сжатия и результатов  их работы являются:

* степень сжатия (compress rating) или отношение (ratio) объемов исходного и результирующего потоков;

* скорость сжатия - время,  затрачиваемое на сжатие некоторого  объема информации входного потока, до получения из него эквивалентного  выходного потока;

* качество сжатия - величина, показывающая на сколько сильно упакован выходной поток, при помощи применения к нему повторного сжатия по этому же или иному алгоритму.

Все способы сжатия можно  разделить на две категории: обратимое (сжатие без потерь) и необратимое  сжатие.

Под необратимым сжатием  подразумевают такое преобразование входного потока данных, при котором  выходной поток, основанный на определенном формате информации, представляет, с некоторой точки зрения, достаточно похожий по внешним характеристикам, на входной поток объект, однако отличается от него объемом.

Такие подходы и алгоритмы  используются для сжатия, например данных растровых графических файлов с низкой степенью повторяемости  байтов в потоке. При таком подходе используется свойство структуры формата графического файла и возможность представить графическую картинку приблизительно схожую по качеству отображения (для восприятия человеческим глазом) несколькими (а точнее n) способами. Поэтому, кроме степени или величины сжатия, в таких алгоритмах возникает понятие качества, т.к. исходное изображение в процессе сжатия изменяется, то под качеством можно понимать степень соответствия исходного и результирующего изображения, оцениваемая субъективно, исходя из формата информации. Для графических файлов такое соответствие определяется визуально, хотя имеются и соответствующие интеллектуальные алгоритмы и программы. Необратимое сжатие невозможно применять в областях, в которых необходимо иметь точное соответствие информационной структуры входного и выходного потоков. Данный подход реализован в популярных форматах представления видео и фото информации, известных как JPEG и JFIF алгоритмы и JPG и JIF форматы файлов.

Обратимое сжатие всегда приводит к снижению объема выходного потока информации без изменения его  информативности, т.е. - без потери информационной структуры.

Более того, из выходного  потока, при помощи восстанавливающего или декомпрессирующего алгоритма, можно получить входной, а процесс  восстановления называется декомпрессией  или распаковкой и только после  процесса распаковки данные пригодны для обработки в соответствии с их внутренним форматом.

Наиболее известные программы-архиваторы для MS-DOS: ARJ (разработчик -- Robert K. Jung), pkzip (компания PKWARE Inc.), lha (Haruyasu Yoshizaki), zoo (Rahul Dhesi). Безусловным лидером во всем мире за последние 5 лет стал архиватор RAR. В настоящее время RAR активно вытесняет ZIP как основную утилиту сжатия FTP архивов в сети INTERNET. RAR я является единственной всемирно используемой программой, созданной русским программистом (за исключением TETRIS). Все архиваторы отличаются используемыми алгоритмами сжатия, форматами архивных файлов, скоростью работы и т.д.

В настоящее время применяется  несколько десятков программ-архиваторов, которые отличаются перечнем функций  и параметрами работы, однако лучшие из них имеют примерно одинаковые характеристики. Из числа наиболее популярных программ можно выделить:

ARJ, РКРАК, LHA, ICE, HYPER, ZIP, РАК, ZOO, EXPAND, разработанные за рубежом, а также AIN и RAR, разработанные в России. Обычно упаковка и распаковка файлов выполняются одной и той же программой, но в некоторых случаях это осуществляется разными программами, например, программа PKZIP производит упаковку файлов, a PKUNZIP — распаковку файлов.

Многие программы-архиваторы производят распаковку файлов, выгружая их на диск, но имеются и такие, которые  предназначены для создания упакованного исполняемого модуля (программы). В  результате такой упаковки создается  программный файл с теми же именем и расширением, который при загрузке в оперативную память самораспаковывается  и сразу запускается. Вместе с  тем возможно и обратное преобразование программного файла в распакованный  формат. К числу таких архиваторов  относятся программы PKLITE, LZEXE, UNP.

Программа EXPAND, входящая в  состав утилит операционной системы MS DOS и оболочки Windows, применяется для распаковки файлов программных продуктов, поставляемых фирмой Microsoft.

Программы-архиваторы RAR и AIN, кроме обычного режима сжатия, имеют  режим solid, в котором создаются архивы с повышенной степенью сжатия и особой структурой организации. В таких архивах все файлы сжимаются как один поток данных, т.е. областью поиска повторяющихся последовательностей символов является вся совокупность файлов, загруженных в архив, и поэтому распаковка каждого файла, если он не первый, связана с обработкой других. Архивы такого типа предпочтительнее использовать для архивирования большого числа однотипных файлов.

 


Информация о работе Архивация данных