Символы и алфавиты для кодирования информации

Автор: Пользователь скрыл имя, 13 Декабря 2012 в 22:21, реферат

Краткое описание

С древних времен знаки используются человеком для долговременного хранения информации и ее передачи на большие расстояния.
Основу любого языка составляет алфавит - конечный набор различных знаков (символов) любой природы, из которых складывается сообщение на данном языке.
Интерпретация, то есть истолкование смысла одного и того же машинного кода, может быть самой разной. Один и тот же код разными программами может рассматриваться и как число, и как текст, и как изображение, и как звук.

Оглавление

Введение………………………………………………………………. 1-3
Кодирование текстовой информации ………………………………. 3-4
Кодирование графической информации …………………………… 4-7

Кодирование звуковой информации ……………………………….. 7-9

Кодирование числовой информации ……………………………….. 9-11

Вывод …………………………………………………………………. 11

Список использованных источников ……………………………….. 12

Файлы: 1 файл

Реферат ИВТ.docx

— 628.55 Кб (Скачать)

 

 

Содержание

 

Введение………………………………………………………………. 1-3

Кодирование текстовой информации ………………………………. 3-4

Кодирование графической  информации …………………………… 4-7

 

Кодирование звуковой информации ………………………………..  7-9

 

Кодирование числовой информации ……………………………….. 9-11

 

Вывод …………………………………………………………………. 11

 

Список использованных источников ……………………………….. 12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Символы и алфавиты для кодирования информации

 

Введение

С древних времен знаки  используются человеком для долговременного  хранения информации и ее передачи на большие расстояния.

Основу любого языка составляет алфавит - конечный набор различных  знаков (символов) любой природы, из которых складывается сообщение  на данном языке.

Генетический алфавит  является «азбукой», на которой строится единая система хранения и передачи наследственной информации живыми организмами. Как слова в языках образуются из букв, так и гены состоят из знаков генетического алфавита.

В процессе хранения, обработки  и передачи информации в компьютере используется двоичная знаковая система, алфавит которой состоит всего  из двух знаков.

В процессах восприятия, передачи, хранения информации живыми организмами, человеком, техническими устройствами происходит ее кодирование.

Системы счисления делятся  на позиционные и непозиционные. Пример непозиционной системы счисления – римская: несколько чисел приняты за основные (например, I, V, X, L, C, D, M), а остальные получаются из основных путем сложения (как VI, VII) или вычитания (как IV, IX).

В непозиционных системах счисления от положения цифры  в записи числа не зависит величина, которую она обозначает.

Пример 1. Число CCXXXII складывается из двух сотен, трех десятков и двух единиц и равно двумстам тридцати двум.

В позиционных системах счисления  величина, обозначаемая цифрой в записи числа, зависит от позиции.

Здесь любое число записывается последовательностью цифр соответствующего алфавита, причем значение каждой цифры  зависит от места (позиции), которое  она занимает в этой последовательности. Например, в записи 555, сделанной  в десятичной системе счисления, использована одна цифра 5, но в зависимости от занимаемого ею места она имеет разное количественное значение – 5 единиц, 5 десятков или 5 сотен.

В современных компьютерах  применяются позиционные системы  счисления, в основном двоичная система.

 

Форма представления данных, содержащая всего две цифры – 0 и 1 позволяет создавать достаточно простые технические устройства для представления (кодирования) и распознавания (дешифровки) информации.

 

1

 

 

 

 

Двоичное кодирование  выбрали для того, чтобы максимально  упростить конструкцию декодирующей машины, ведь дешифратор должен уметь различать всего два состояния (например, 1 – есть ток в цепи, 0 – тока в цепи нет). По этой причине двоичная система и нашла такое широкое применение.

Перевод числа из десятичной системы счисления в двоичную (1-й способ).

 

Этот способ перехода от записи числа в десятичною системе счисления к записи его в двоичной системе состоит в представлении числа в виде суммы степеней двойки и последующем выделении коэффициентов такого представления.

Код - набор условных обозначений для представления информации.

Кодирование - процесс представления информации в виде кода (представление символов одного алфавита символами другого; переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки).

Обратное преобразование называется декодированием.

Для общения друг с другом мы используем код - русский язык.

При разговоре этот код  передается звуками, при письме - буквами.

Водитель передает сигнал с помощью гудка или миганием фар.

Мы встречаемся с кодированием информации при переходе дороги в  виде сигналов светофора.

Таким образом, кодирование  сводиться к использованию совокупности символов по строго определенным правилам.

Способ кодирования зависит  от цели, ради которой оно осуществляется:

  • сокращение записи;
  • засекречивание (шифровка) информации;
  • удобство обработки;
  • и т. п.

Существуют три основных способа кодирования текста:

  • графический – с помощью специальных рисунков или значков;
  • числовой – с помощью чисел;
  • символьный – с помощью символов того же алфавита, что и исходный текст.

 

Наиболее значимым для  развития техники оказался способ представления  информации с помощью кода, состоящего всего из двух символов: 0 и 1.

 

Для удобства использования  такого алфавита договорились называть  любой из его знаков «бит» (от английского  «binary digit» -двоичный знак).

 

Одним битом могут быть выражены два понятия: 0 или 1 (да или  нет, черное или белое, истина или  ложь и т.п.).

2

 

 

 

 

Двоичные числа очень  удобно хранить и передавать с  помощью электронных устройств.

Поэтому данные в компьютере на физическом уровне хранятся, обрабатываются и передаются именно в двоичном коде.

Последовательностью битов  можно закодировать текст, изображение, звук или какую-либо другую информацию.

Таким образом, двоичный код  является универсальным средством  кодирования информации.

 

 

Кодирование текстовой информации

 

 

Если каждому символу  алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно  кодировать и текстовую информацию. Для хранения двоичного кода одного символа выделен 1 байт = 8 бит.

Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно:

= 256

Значит, с помощью 1 байта  можно получить 256 разных двоичных кодовых  комбинаций и отобразить с их помощью 256 различных символов.

Такое количество символов вполне достаточно для представления  текстовой информации, включая прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д.

Кодирование заключается  в том, что каждому символу  ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий  ему двоичный код от 00000000 до 11111111.

Важно, что присвоение символу  конкретного кода - это вопрос соглашения, которое фиксируется в кодовой  таблице.

Кодирование текстовой информации с помощью байтов опирается на несколько различных стандартов, но первоосновой для всех стал стандарт ASCII (American Standart Code for Information Interchange), разработанный в США в Национальном институте ANSI (American National Standarts Institute).

 

С распространением современных  информационных технологий в мире возникла необходимость кодировать символы алфавитов других языков: японского, корейского, арабского, хинди, а также других специальных символов.

На смену старой системе  пришла новая универсальная – UNICODE, в которой один символ кодируется не одним, а двумя байтами.

 

3

 

 

 

 

В настоящее время существует много различных кодовых таблиц (DOS, ISO, WINDOWS, KOI8-R, KOI8-U, UNICODE и др.), поэтому  тексты, созданные в одной кодировке,  могут не правильно отображаться в другой.

 

 

Кодирование графической информации

 

Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется  из определенного количества строк, которые, в свою очередь, содержат определенное количество точек.

 

Если посмотреть на экран компьютера через увелечительное стекло, то в зависимости от марки и модели техники мы увидим либо множество разноцветных прямоугольничков, либо множество разноцветных кружочков.

И те, и другие группируются по три штуки, причем одного цвета, но разных оттенков.

Они называются ПИКСЕЛЯМИ (от английского PICture's ELement).

Пиксели бывают только трех цветов - зеленого, синего и красного.

Рассмотрим самый простой  случай - каждый кусочек пикселя  может либо гореть (1), либо не гореть (0). Тогда мы получаем следующий набор  цветов:

 

Число цветов, воспроизводимых  на экране монитора (N), и число бит, отводимых в видеопамяти на каждый пиксель (I), связаны формулой:

Величину I называют битовой  глубиной или глубиной цвета.

Чем больше битов используется, тем больше оттенков цветов можно  получить.

 

Итак, любое графическое  изображение на экране можно закодировать c помощью чисел, сообщив, сколько в каждом пикселе долей красного, сколько - зеленого, а сколько - синего цветов.

 

Также графическая информация может быть представлена в виде векторного изображения.

 

Векторное изображение представляет собой графический объект, состоящий из элементарных отрезков и дуг.

Положение этих элементарных объектов определяется координатами точек  и длиной радиуса.

 

4

 

 

 

 

Информация о векторном  изображении кодируется как обычная  буквенно-цифровая и обрабатывается специальными программами.

 

Качество изображения  определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается.

Графическую информацию можно  представлять в двух формах: аналоговой или дискретной. Живописное полотно, цвет которого изменяется непрерывно - это пример аналогового представления, а изображение, напечатанное при помощи струйного принтера и состоящее из отдельных точек разного цвета - это дискретное представление. Путем разбиения графического изображения (дискредитации) происходит преобразование графической информации из аналоговой формы в дискретную. Ее можно сравнить с построением изображения из большого количества маленьких цветных фрагментов (метод мозаики). Все изображение разбивается на отдельные точки, каждому элементу ставится в соответствие код его цвета. При этом качество кодирования будет зависеть от следующих параметров: размера точки и количества используемых цветов. Чем меньше размер точки, а, значит, изображение составляется из большего количества точек, тем выше качество кодирования.

 

Чем большее количество цветов используется (т. е. точка изображения  может принимать больше возможных  состояний), тем больше информации несет  каждая точка, а, значит, увеличивается  качество кодирования. Создание и хранение графических объектов возможно в нескольких видах - в виде векторного, фрактального или растрового изображения. Отдельным предметом считается 3D (трехмерная) графика, в которой сочетаются векторный и растровый способы формирования изображений. Она изучает методы и приемы построения объемных моделей объектов в виртуальном пространстве. Для каждого вида используется свой способ кодирования графической информации. Векторное изображение представляет собой графический объект, состоящий из элементарных геометрических фигур.

 

Растровое изображение представляет собой совокупность точек (пикселей), полученных в результате дискретизации изображения в соответствии с матричным принципом.

 

Матричный принцип кодирования  графических изображений заключается  в том, что изображение разбивается  на заданное количество строк и столбцов. Затем каждый элемент полученной сетки кодируется по выбранному правилу.

 

При помощи увеличительного  стекла можно увидеть, что черно-белое  графическое изображение, например из газеты, состоит из мельчайших точек, составляющих определенный узор - растр.

5

 

 

 

 

Во Франции в 19 веке возникло новое направление в живописи - пуантилизм. Его техника заключалась в том, что на холст рисунок наносился кистью в виде разноцветных точек. Также этот метод издавна применяется в полиграфии для кодирования графической информации. Точность передачи рисунка зависит от количества точек и их размера.

Объем растрового изображения  определяется умножением количества пикселей (на информационный объем одной точки, который зависит от количества возможных  цветов. Качество изображения определяется разрешающей способностью монитора. Чем она выше, то есть больше количество строк растра и точек в строке, тем выше качество изображения. В современных ПК в основном используют следующие разрешающие способности экрана: 640 на 480, 800 на 600, 1024 на 768 и 1280 на 1024 точки.

Если говорить о черно-белых  иллюстрациях, то, если не использовать полутона, то пиксель будет принимать  одно из двух состояний: светится (белый) и не светится (черный). А так как  информация о цвете пикселя называется кодом пикселя, то для его кодирования  достаточно одного бита памяти: 0 - черный, 1 - белый. Если же рассматриваются иллюстрации в виде комбинации точек с 256 градациями серого цвета, то достаточно восьмиразрядного двоичного числа для того чтобы закодировать яркость любой точки. В компьютерной графике чрезвычайно важен цвет. Он выступает как средство усиления зрительного впечатления и повышения информационной насыщенности изображения.

Информация о работе Символы и алфавиты для кодирования информации