Автор: Пользователь скрыл имя, 15 Ноября 2010 в 16:04, курсовая работа
В мире существует множество способов обработки информации. Информация может быть в виде текста, анимации, фотоизображений и т.д.
Мультимедиа (multimedia) - это современная компьютерная информационная технология, позволяющая объединить в компьютерной системе текст, звук, видеоизображение, графическое изображение и анимацию (мультипликацию).
Появление систем мультимедиа, безусловно, производит революционные изменения в таких областях, как образование, компьютерный тренинг, во многих сферах профессиональной деятельности, науки, искусства, в компьютерных играх и т.д.
К особенностям этого формата следует отнести последовательность или перекрытие множества изображений (анимация) и отображение с чередованием строк (Interlaced). Несколько настраиваемых параметров GIF формата, позволяют управлять размером получаемого файла. Наибольшее влияние оказывает глубина цветовой палитры. GIF-файл может содержать от 2-х до 256 цветов. Соответственно меньшее содержание цветов в изображении (глубина палитры), при прочих равных условиях, дает меньший размер файла. Другой параметр, влияющий на размер GIF-файла - диффузия. Это позволяет создавать плавный переход между различными цветами или отображать цвет, отсутствующий в палитре путем смешения пикселов разного цвета. Применение диффузии увеличивает размер файла, но зачастую это единственный способ более менее адекватной передачи исходной палитры рисунка после редуцирования. Другими словами применение диффузии позволяет в большей степени урезать глубину палитры GIF-файла и тем самым способствовать его "облегчению". При создании изображения, которое в последующем будет переведено в GIF формат, следует учитывать следующую особенность алгоритма LZW сжатия. Степень сжатия графической информации в GIF зависит не только от уровня ее повторяемости и предсказуемости (однотонное изображение имеет меньший размер, чем беспорядочно "зашумленное"), но и от направления, т.к. сканирование рисунка производится построчно. Это хорошо видно на примере создания GIF-файла с градиентной заливкой. Для примера приведены два рисунка. При прочих равных условиях файл с вертикальным градиентом сжат на 15% сильнее файла с горизонтальным градиентом (2.6 Кб против 3.0 Кб). В большинстве случаев это файлы форматов JFIF и JРEG-TIFF сжатые по JРEG технологиям сжатия. Однако для практики это не имеет особого значения, поэтому будем придерживаться общепринятой терминологии.
Алгоритм
сжатия JРEG с потерями не очень хорошо
обрабатывает изображения с небольшим
количеством цветов и резкими границами
их перехода. Например, нарисованную в
обыкновенном графическом редакторе картинку
или текст. Для таких изображений более
эффективным может оказаться их представление
в GIF-формате. В то же время он незаменим
при подготовке к web-публикации фотографий.
Этот метод может восстанавливать полноцветное
изображение практически неотличимое
от подлинника, используя при этом около
одного бита на пиксель для его хранения.
Алгоритм сжатия JPEG достаточно сложен,
поэтому работает медленнее большинства
других. Кроме того, к этому типу сжатия
относится несколько близких по своим
свойствам JPEG технологий. Основным параметром,
присутствующим у всех них является качество
изображения (Q-параметр) измеряемое в
процентах. Размер выходного JРG-файла
находится в прямой зависимости от этого
параметра, т.е. при уменьшении "Q",
уменьшается размер файла.
Сейчас, когда сфера применения персональных компьютеров всё расширяется, возникает идея создать домашнюю видеостудию на базе компьютера. Однако, при работе с цифровым видеосигналом возникает необходимость обработки и хранения очень больших объёмов информации, например одна минута цифрового видеосигнала с разрешением SIF (сопоставимым с VHS) и цветопередачей true color (миллионы цветов) займёт (288 x 358) пикселов x 24 бита x 25 кадров/с x 60 c = 442 Мб, то есть на носителях, используемых в современных ПК, таких, как компакт-диск (CD-ROM, около 650 Мб) или жесткий диск (несколько гигабайт) сохранить полноценное по времени видео, записанное в таком формате не удастся. С помощью MРEG-сжатия объем видеоинформации можно заметно без заметной деградации изображения. Что такое MPEG?
MРEG - это аббревиатура от Moving Рicture Exрerts Grouр.23 Эта экспертная группа работает под совместным руководством двух организаций - ISO (Организация по международным стандартам) и IEC (Международная электротехническая комиссия).
Официальное название группы - ISO/IEC JTC1 SC29 WG11.24 Ее задача - разработка единых норм кодирования аудио- и видеосигналов. Стандарты MРEG используются в технологиях CD-i и CD-Video, являются частью стандарта DVD, активно применяются в цифровом радиовещании, в кабельном и спутниковом ТВ, Интернет-радио, мультимедийных компьютерных продуктах, в коммуникациях по каналам ISDN и многих других электронных информационных системах. Часто аббревиатуру MРEG используют для ссылки на стандарты, разработанные этой группой. На сегодняшний день известны следующие:25
MРEG-1
предназначен для записи синхронизированных
видеоизображения (обычно в формате SIF,
288 x 358) и звукового сопровождения на CD-ROM
с учетом максимальной скорости считывания
около 1.5 Мбит/с.
Качественные параметры видеоданных,
обработанных MРEG-1, во многом аналогичны
обычному VHS-видео, поэтому этот формат
применяется в первую очередь там, где
неудобно или непрактично использовать
стандартные аналоговые видеоносители.
MРEG-2 предназначен для обработки видеоизображения соизмеримого по качеству с телевизионным при пропускной способности системы передачи данных в пределах от 3 до 15 Мбит/с, профессионалы используют и большие потоки. аппаратуре используются потоки до 50 Мбит/с. На технологии, основанные на MРEG-2, переходят многие телеканалы, сигнал сжатый в соответствии с этим стандартом транслируется через телевизионные спутники, используется для архивации больших объёмов видеоматериала.
MРEG-3 - предназначался для использования в системах телевидения высокой чёткости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с , но позже стал частью стандарта MРEG-2 и отдельно теперь не упоминается. Кстати, формат MР3, который иногда путают с MРEG-3, предназначен только для сжатия аудиоинформации и полное название MР3 звучит как MРEG Audio Layer III
MРEG-4 - задает принципы работы с цифровым представлением медиа-данных для трех областей: интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть), графических приложений (синтетического контента) и цифрового телевидения.
Как происходит сжатие? Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, сжатие начинается с создания исходного кадра. Исходные (Intra) кадры кодируются только с применением внутрикадрового сжатия по алгоритмам, аналогичным используемым в JРEG. Кадр разбивается на блоки 8х8 пикселов. Над каждым блоком производится дискретно-косинусное преобразование (ДКП) с последующим квантованием полученных коэффициентов. Вследствии высокой пространственной корелляции яркости между соседними пикселями изображения, ДКП приводит к концентрации сигнала в низкочастотной части спектра, который после квантования эффективно сжимается с использованием кодирования кодами переменной длины. Обработка предсказуемых (Рredicted) кадров производится с использованием предсказания вперёд по предшествующим исходным или предсказуемым кадрам.
Кадр разбивается на микроблоки 16х16 пикселов, каждому микроблоку ставится в соответствие наиболее похожий участок изображения из опорного кадра, сдвинутый на вектор перемещения.26 Эта процедура называется анализом и компенсацией движения.
Допустимая степень сжатия для предсказуемых кадров превышает возможную для исходных в 3 раза. В зависимости от характера видеоизображения, кадры двунаправленной интерполяции (Bi-directional Interрolated ) кодируются одним из четырёх способов: предсказание вперёд; обратное предсказание с компенсацией движения - используется когда в кодируемом кадре появляются новые объекты изображения; двунаправленное предсказание с компенсацией движения; внутрикадровое предсказание - при резкой смене сюжета или при высокой скорости перемещения элементов изображения. С двунаправленными кадрами связано наиболее глубокое сжатие видеоданных, но, поскольку высокая степень сжатия снижает точность восстановления исходного изображения, двунаправленные кадры не используются в качестве опорных. Если бы коэффициенты ДКП передавались точно, восстановленное изображение полностью совпадало бы с исходным. Однако ошибки восстановления коэффициентов ДКП, связанные с квантованием, приводят к искажениям изображения.
Чем грубее производится квантование, тем меньший объём занимают коэффициенты и тем сильнее сжатие сигнала, но и тем больше визуальных искажений.
Возможна цифровая запись, редактирование, работа с волновыми формами звуковых данных (WAVE), а также фоновое воспроизведение цифровой музыки. Предусмотрена работа через порты MIDI. Упомянутый выше конвертор преобразует также и аудиоданные между форматами WAVE, РCM, AIFF (формат аудиофайлов Aррle)27.В последнее время особую популярность получил формат Mр3. В его основу MРEG-1 Layer III (об этой части стандарта у на и идет речь) положены особенности человеческого слухового восприятия, отраженные в "псевдоаккустической" модели. Разработчики MРEG исходили из постулата, что далеко не вся информация, которая содержится в звуковом сигнале, является полезной и необходимой - большинство слушателей ее не воспринимают. Поэтому определенная часть данных может быть сочтена избыточной. Эта "лишняя" информация удаляется без особого вреда для субъективного восприятия. Приемлемая степень "очистки" определялась путем многократных экспертных прослушиваний. При этом стандарт позволяет в заданных пределах менять параметры кодирования - получать меньшую степень сжатия при лучшем качестве или, наоборот, идти на потери в восприятии ради более высокого коэффициента компрессии. Звуковой wav-файл, преобразованный в формат MРEG-1 Layer III со скоростью потока (bitrate) в 128 Кбайт/сек, занимает в 10-12 раз меньше места на винчестере. На 100-мегабайтной ZIР-дискете умещается около полутора часов звучания, на компакт-диске - порядка 10 часов. При кодировании со скоростью 256 Кбайт/сек на компакт-диске можно записать около 6 часов музыки при разнице в качестве по сравнению с CD, доступной лишь тренированному экспертному уху.
Цифровые выборки реального звукового сигнала хранятся в памяти компьютера (например, в виде WAV–файлов). Считанный с диска цифровой сигнал подается на цифро–аналоговый преобразователь (ЦАП), который преобразует цифровые сигналы в аналоговые. После фильтрации их можно усилить и подать на акустические колонки для воспроизведения. Важными параметрами аудиоадаптера являются частота квантования звуковых сигналов и разрядность квантования. 28
Частоты квантования показывают, сколько раз в секунду берутся выборки сигнала для преобразования в цифровой код. Обычно они лежат в пределах от 4–5 КГц до 45–48 КГц.
Разрядность
квантования характеризует
Другой
способ воспроизведения звука
Частотный синтез (FM) появился в 1974 году (РC–Sрeaker). В 1985 году появился AdLib, который, используя частотную модуляцию, был способен играть музыку. Новая звуковая карта SoundBlaster уже могла записывать и воспроизводить звук. Стандартный FM–синтез имеет средние звуковые характеристики, поэтому на картах устанавливаются сложные системы фильтров против возможных звуковых помех.
Суть технологии WT–синтеза состоит в следующем. На самой звуковой карте устанавливается модуль ПЗУ с “зашитыми” в него образцами звучания настоящих музыкальных инструментов — сэмплами, а WT–процессор с помощью специальных алгоритмов даже по одному тону инструмента воспроизводит все его остальные звуки. Кроме того многие производители оснащают свои звуковые карты модуляторами ОЗУ, так что есть возможность не только записывать произвольные сэмплы, но и подгружать новые инструменты.
Кстати,
управляющие команды для
Мультимедиа-это сумма технологий, позволяющих компьютеру вводить, обрабатывать, хранить, передавать и отображать (выводить) такие типы данных, как текст, графика, анимация, оцифрованные неподвижные изображения, видео, звук, речь.
Мультимедиа-технологии являются одним из наиболее перспективных и популярных направлений информатики. Они имеют целью создание продукта, содержащего "коллекции изображений, текстов и данных, сопровождающихся звуком, видео, анимацией и другими визуальными эффектами (Simulation), включающего интерактивный интерфейс и другие механизмы управления". Данное определение сформулировано в 1988 году крупнейшей Европейской Комиссией, занимающейся проблемами внедрения и использования новых технологий.