Измерение информации

Автор: Пользователь скрыл имя, 01 Ноября 2011 в 16:08, реферат

Краткое описание

Разные люди, получившие одно и то же сообщение, по-разному оценивают его информационную ёмкость, то есть количество информации, содержащееся в нем. Это происходит оттого, что знания людей о событиях, явлениях, о которых идет речь в сообщении, до получения сообщения были различными. Поэтому те, кто знал об этом мало, сочтут, что получили много информации, те же, кто знал больше, могут сказать, что информации не получили вовсе. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя.

Файлы: 1 файл

реферат по информатике.docx

— 73.28 Кб (Скачать)

Тогда, например, объем винчестера – 3 гигабайта; объем основной памяти компьютера – 32 мегабайта и т.д.

Очевидно, геометрическая мера не учитывает, какими символами заполнено сообщение. Так, одинаковыми по количеству информации, измеренной геометрической мерой, являются, например, сообщения «компьютер»  и «программа»; а также 346 и 10В

Комбинаторная мера

Оценивает возможность представления информации при помощи различных комбинаций информационных элементов в заданном объеме. Использует типы комбинаций элементов  и соответствующие математические соотношения, которые приводятся в  одном из разделов дискретной математики – комбинаторике.

Комбинаторная мера может использоваться для оценки информационных возможностей некоторого автомата, который способен генерировать дискретные сигналы (сообщения) в соответствии с определенным правилом комбинаторики. Пусть, например, есть автомат, формирующий двузначные десятичные целые положительные числа (исходное множество информационных элементов {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}). В соответствии с положениями комбинаторики, данный автомат генерирует размещения (различаются числа, например, 34 и 43) из 10 элементов (используются 10 цифр) по 2 (по условию задачи, формируются двузначные числа) с повторениями (очевидно, возможны числа, состоящие из одинаковых цифр, например, 33). Тогда можно оценить, сколько различных сообщений (двузначных чисел) может сформировать автомат, иначе говоря, можно оценить информационную емкость данного устройства: Рп(102) = 102 = 100.

Комбинаторная мера используется для определения  возможностей кодирующих систем, которые  широко используются в информационной технике.

Пример 1. Определить емкость ASCII-кода, представленного  в двоичной или шестнадцатеричной  системе счисления.

ASCII-код  – это сообщение, которое формируется  как размещение с повторениями:

для двоичного  представления – из информационных элементов {0, 1}, сообщение длиной (объемом) 8 символов;

для шестнадцатеричного представления – из информационных элементов {0, 1, 2, …., А, В, С, …. F}, сообщение  длиной (объемом) 2 символа.

Тогда в соответствии с положениями  комбинаторики:

= () = = 256;

= () = 256,

где , – количества информации, соответственно, для двоичного и шестнадцатеричного представления ASCII-кода.

Таким образом, емкость ASCII-кода для двоичного  и шестнадцатеричного представления  одинакова и равна 256.

Следует отметить, что все коды постоянной длины формируются по правилам комбинаторики или их комбинациям. В случае, когда сообщения формируются как размещения с повторениями из элементов алфавита мощности h и известно количество сообщений М, можно определить требуемый объем сообщения (т.е. его длину l) для того, чтобы в этом объеме представить все сообщения: l=   М .                                       

Например, есть 4 сообщения – a, b, c, d. Выполняется  двоичное кодирование этих сообщений  кодом постоянной длины. Для этого  требуются 2 двоичных разряда. В самом деле: l =   4  = 2.

Очевидно, комбинаторная мера является развитием  геометрической меры, так как помимо длины сообщения учитывает объем  исходного алфавита и правила, по которым из его символов строятся сообщения.Особенностью комбинаторной  меры является то, что ею измеряется информация не конкретного сообщения, а всего множества сообщений, которые могут быть получены.Единицей измерения информации в комбинаторной мере является число комбинаций информационных элементов.

Аддитивная  мера

Эта мера предложена в 1928 году американским ученым Хартли, поэтому имеет второе название – мера Хартли. Хартли впервые ввел специальное обозначение для  количества информации – I и предложил  следующую логарифмическую зависимость  между количеством информации и  мощностью исходного алфавита:

I = l log h,       

где I –  количество информации, содержащейся в сообщении;

l – длина сообщения;

h –  мощность исходного алфавита.

При исходном алфавите {0,1}; l = 1; h = 2 и основании  логарифма, равном 2, имеем

I = 1* = 1.

Единицей  измерения информации в аддитивной мере является бит.

Пример 1. Рассчитать количество информации, которое  содержится в шестнадцатеричном  и двоичном представлении ASCII-кода для  числа 1.

В соответствии с таблицей ASCII-кодов имеем: шестнадцатеричное  представление числа 1 – 31, двоичное представление числа 1 – 00110001.       

Тогда по формуле Хартли получаем:

для шестнадцатеричного представления        I = 216 = 8 бит; 

для двоичного  представления                I = 8 2 = 8 бит.

Таким образом, разные представления ASCII-кода для одного символа содержат одинаковое количество информации, измеренной аддитивной мерой.

2.2 Статистический подход к измерению информации

В 30-х  годах ХХ века  американский ученый Клод Шеннон предложил связать количество информации, которое несет в себе некоторое сообщение, с вероятностью получения этого сообщения.

     Вероятность p – количественная априорная (т.е. известная до проведения опыта) характеристика одного из исходов (событий) некоторого опыта. Измеряется в пределах от 0 до 1. Если заранее известны все исходы опыта, сумма их вероятностей равна 1, а сами исходы составляют полную группу событий. Если все исходы могут свершиться с одинаковой долей вероятности, они называются равновероятными.

     Например, пусть опыт состоит в сдаче  студентом экзамена по информатике. Очевидно, у этого опыта всего 4 исхода (по количеству возможных оценок, которые студент может получить на экзамене). Тогда эти исходы составляют полную группу событий, т.е. сумма их вероятностей равна 1. Если студент  учился хорошо в течение семестра, значения вероятностей всех исходов  могут быть такими:

     p(5) = 0.5; p(4) = 0.3; p(3) = 0.1; p(2) = 0.1, где запись p(j) означает вероятность исхода, когда получена оценка j (j = {2, 3, 4, 5}).

     Если  студент учился плохо, можно заранее  оценить возможные исходы сдачи  экзамена, т.е. задать вероятности исходов, например, следующим образом:

p(5) = 0.1; p(4) = 0.2; p(3) = 0.4; p(2) = 0.3.       

В обоих случаях выполняется условие: 
 

где n – число исходов опыта,

i – номер одного из исходов.

     Пусть можно получить n сообщений по результатам некоторого опыта (т.е. у опыта есть n исходов), причем известны вероятности получения каждого сообщения (исхода) - . Тогда в соответствии с идеей Шеннона, количество информации I в сообщении i определяется по формуле: 

     I = -,                                       

где – вероятность i-го сообщения (исхода).

     Таким образом, количество получаемой с сообщением информации тем больше, чем неожиданнее  данное сообщение. Этот тезис использован  при эффективном кодировании  кодами переменной длины (т.е. имеющими разную геометрическую меру): исходные символы, имеющие большую частоту (или вероятность), имеют код меньшей  длины, т.е. несут меньше информации в геометрической мере, и наоборот.

     Формула Шеннона позволяет определять также  размер двоичного эффективного кода, требуемого для представления того или иного сообщения, имеющего определенную вероятность появления.

     Единица измерения информации при статистическом подходе – бит.

На практике часто вместо вероятностей используются частоты исходов. Это возможно, если опыты проводились ранее и  существует определенная статистика их исходов. Так, строго говоря, в построении эффективных кодов участвуют  не частоты символов, а их вероятности.

2.3 Семантический подход к измерению информации

Учитывает целесообразность и полезность информации. Применяется при оценке эффективности  получаемой информации и ее соответствия реальности. В рамках этого подхода рассмотрим такие меры, как целесообразность, полезность (учитывают прагматику информации) и истинность информации (учитывает семантику информации). 

Целесообразность  информации

Количество I получаемой вместе с сообщением информации с позиций ее целесообразности определяется по формуле: 

где , – вероятности достижения цели после и до получения сообщения, соответственно.

Пример 1. Пусть вероятность  сдачи экзамена по информатике до получения сообщения (подсказки от соседа) оценивается студентом со значением 0,2. После того, как ему удалось получить подсказку, вероятность сдачи увеличилась: = 0,8. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.В соответствии с приведенной формулой  имеем: I = (0,8/0,2) = 4 = 2.

Полезность  информации.

     Количество  усваиваемой потребителем информации Iусв тесно связано с теми знаниями, которые имеет потребитель к моменту получения информации – с тезаурусом (ТЗ) потребителя. Этим определяется полезность информации. В самом деле, для усвоения тех знаний, которые получаются в  ВУЗе, требуется среднее образование - иначе студент ничего не поймет. С другой стороны, любая учебная дисциплина ориентируется на знания, которые учащийся должен приобрести в предыдущих курсах. Этим объясняется последовательность учебных дисциплин по годам обучения.

      Зависимость усваиваемой потребителем информации от его тезауруса выражается графически следующей кривой: 
 

     Как видно из графика, при тезаурусе, равном нулю и максимальному значению в точке max, информация не усваивается: в первом случае, потребителю непонятна принимаемая информация, во втором – она ему уже известна. Максимально усваивается информация (т.е. она наиболее полезна) в точке opt, когда потребитель обладает достаточным (но не максимально возможным) тезаурусом для понимания получаемой информации. При значении тезауруса i-го потребителя ТЗi количество усваиваемой им информации определяется как Iусв = f(ТЗi). Сам тезаурус ТЗi может быть практически определен как результат интеллектуального тестирования, которое проводится, например, в некоторых западных странах. При таком тестировании человеку выставляется некоторый балл, который и может расцениваться как его ТЗi.

Истинность  информации.

     Эта мера оценивает информацию с позиций  ее соответствия отображаемому источнику  информации, т.е. реальному миру.

Оценить истинность сложного сообщения  можно, разбив его на простые. Например, сообщение  mess:  «данное пособие посвящено информатике и имеет объем 5 страниц»       

можно представить как два простых  сообщения mess1 и mess2:

mess1 - «данное пособие посвящено информатике»        ,

mess2 -  «данное пособие имеет объем 5 страниц».       

     Тогда можно предложить рассчитывать истинность сложного сообщения как среднее  арифметическое значение истинностей  сообщений, его составляющих (что  называют - «истинно лишь наполовину»). В таком случае имеем:

r(mess) = Ѕ  (r(mess1) + r(mess2)) = Ѕ (1 + 0) = 0,5. 
 
 
 

Заключение

     Мощность  информационного сигнала, также  как и вес носителя информации не могут служить оценкой количества информации, переносимой сигналом. Так как информатика имеет  дело с процессами передачи и хранения информации, то важное значение имеет  количественное измерение информации. При этом разные подходы к измерению  информации применяются в быту, технике  и в теории информации.При таком  подходе непонятно, по каким критериям  можно ввести единицу измерения  информации. Следовательно, с точки  зрения информации как новизны мы не можем оценить количество информации, содержащейся в научном открытии, новой теории общественного развития.

Информация о работе Измерение информации