Система IP-адресов.Законы Зипфа

Автор: Пользователь скрыл имя, 10 Февраля 2013 в 12:52, контрольная работа

Краткое описание

IP-адрес (от английского Internet Protocol Adress) - это уникальный адрес или идентификатор компьютера или устройства, используемого для подключения к сети Интернет.
Форматы адреса

Оглавление

1 Система IP – адресов.
2 Законы Зипфа.
Библиографический список

Файлы: 1 файл

Контрольная Информатика.doc

— 79.00 Кб (Скачать)

Содержание

1 Система IP – адресов.

2 Законы Зипфа.

Библиографический список

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1  Система IP-адресов.

IP-адрес (от английского Internet Protocol Adress) - это уникальный адрес или идентификатор компьютера или устройства, используемого для подключения к сети Интернет.

Форматы адреса

IPv4

В 4-й версии IP-адрес  представляет собой 32-битовое число. Удобной формой записи IP-адреса (IPv4) является запись в виде четырёх десятичных чисел значением от 0 до 255, разделённых точками, например, 192.168.0.1.

IPv6

В 6-й версии IP-адрес (IPv6) имеет 128-битовое представление. Адреса разделяются двоеточиями (напр. fe80:0:0:0:200:f8ff: fe21:67cf). Большое количество нулевых групп может быть пропущено с помощью двойного двоеточия (fe80::200:f8ff: fe21:67cf). Такой пропуск может быть единственным в адресе.

При использовании специальных  сервисов, по IP-адресу можно определить страну, город, регион и иногда даже физический адрес пользователя. Ip-адрес назначается не простым случайным перебором цифр, а по определенной схеме, таким образом, каждая страна и город имеют свои допустимые диапазоны цифр.

IP-адреса представляют собой основной тип адресов, на основании которых сетевой уровень протокола IP передаёт пакеты между сетями. IP-адрес назначается администратором во время конфигурирования компьютеров и маршрутизаторов.

IP-адрес состоит из двух частей: номера сети и номера узла. В случае изолированной сети её адрес может быть выбран администратором из специально зарезервированных для таких сетей блоков адресов (192.168.0.0/16, 172.16.0.0/12 или 10.0.0.0/8). Если же сеть должна работать как составная часть Интернета, то адрес сети выдаётся провайдером либо pегиональным  интернет-регистратором (Regional Internet Registry, RIR).

Всего существует пять RIR:

- ARIN, обслуживающий Северную Америку;

- APNIC, обслуживающий страны Юго-Восточной Азии;

- AfriNIC, обслуживающий страны Африки;

- LACNIC, обслуживающий страны Южной Америки и бассейна Карибского моря;

- RIPE NCC, обслуживающий Европу, Центральную Азию, Ближний Восток.

 

Региональные регистраторы получают номера автономных систем и  большие блоки адресов у ICANN, а затем выдают номера автономных систем и блоки адресов меньшего размера локальным  интернет-регистраторам  (Local Internet Registries, LIR), обычно являющимся крупными провайдерами.

Номер узла в протоколе IP назначается независимо от локального адреса узла. Маршрутизатор по определению входит сразу в несколько сетей. Поэтому каждый порт маршрутизатора имеет собственный IP-адрес. Конечный узел также может входить в несколько IP-сетей. В этом случае компьютер должен иметь несколько IP-адресов, по числу сетевых связей. Таким образом, IP-адрес характеризует не отдельный компьютер или маршрутизатор, а одно сетевое соединение.

Есть два способа определения  того сколько бит отводится на маску подсети, а сколько на IP-адрес.

Изначально использовалась классовая адресация (INET), но со второй половины 90-х годов XX века она была вытеснена бесклассовой адресацией (CIDR), при которой количество адресов в сети определяется маской подсети.

Иногда встречается запись IP-адресов  вида 192.168.5.0/24. Данный вид записи заменяет собой указание диапазона IP-адресов. Число после косой черты означает количество единичных разрядов в маске подсети. Для приведённого примера маска подсети будет иметь двоичный вид 11111111 11111111 11111111 00000000 или то же самое в десятичном виде: 255.255.255.0. 24 разряда IP-адреса отводятся под номер сети, а остальные 32-24=8 разрядов полного адреса — под адреса хостов этой сети и адрес этой сети, и широковещательный адрес этой сети. Итого, 192.168.5.0/24 означает диапазон адресов хостов от 192.168.5.1 до 192.168.5.254 и 192.168.5.0 - адрес сети и 192.168.5.255 - широковещательный адрес сети. Для вычисления адреса сети и широковещательного адреса сети используются формулы:

адрес сети = IP. Любого компьютера этой сети AND MASK (адрес сети позволяет определить, что компьютеры в одной сети)

широковещательный адрес  сети = IP. Любого компьютера этой сети OR NOT(MASK) (широковещательный адрес сети воспринимается всеми компьютерами сети как дополнительный свой адрес, т.е. пакет на этот адрес получат все хосты сети, как адресованные лично им. Если на сетевой интерфейс хоста, который не является маршрутизатором пакетов попадёт пакет, адресованный не ему, то он будет отброшен).

Статические и динамические IP-адреса

IP-адрес называют статическим (постоянным, неизменяемым), если он назначается пользователем в настройках устройства, либо если назначается автоматически при подключении устройства к сети и не может быть присвоен другому устройству.

IP-адрес называют динамическим (непостоянным, изменяемым), если он назначается автоматически при подключении устройства к сети и используется в течение ограниченного промежутка времени, указанного в сервисе назначавшего IP-адрес (DHCP).

Для получения IP-адреса клиент может  использовать один из следующих протоколов:

DHCP (RFC 2131) — наиболее распространённый протокол настройки сетевых параметров.

BOOTP (RFC 951) — простой протокол настройки сетевого адреса, обычно используется для бездисковых станций.

IPCP (RFC 1332) в рамках протокола PPP (RFC 1661).

Zeroconf (RFC 3927) — протокол настройки сетевого адреса, определения имени, поиск служб.

RARP (RFC 903) Устаревший протокол, использующий обратную логику (из аппаратного адреса — в логический) популярного в широковещательных сетях протокола ARP. Не поддерживает распространения информации о длине маски (не поддерживает VLSM).

Особые IP-адреса

 В протоколе IP существует  несколько соглашений об особой  интерпретации IP-адресов:

- eсли весь IP-адрес состоит только из двоичных нулей, то он обозначает адрес того узла, который сгенерировал этот пакет; этот режим используется только в некоторых сообщениях ICMP;

- eсли в поле номера  сети стоят только нули, то  по умолчанию считается, что  узел назначения принадлежит той же самой сети, что и узел, который отправил пакет;

- eсли все двоичные  разряды IP-адреса равны 1, то  пакет с таким адресом назначения  должен рассылаться всем узлам,  находящимся в той же сети, что и источник этого пакета. Такая рассылка называется ограниченным широковещательным сообщением (limited broadcast);

- eсли в поле номера  узла назначения стоят только  единицы, то пакет, имеющий  такой адрес, рассылается всем  узлам сети с заданным номером  сети. Например, в сети 192.190.21.0 с маской 255.255.255.0 пакет с адресом 192.190.21.255 доставляется всем узлам сети этой сети. Такая рассылка называется широковещательным сообщением (broadcast).

 

 

 

 

 

 

2  Законы Зипфа.

George Kingsley Zipf  родился в США в 1902 году, он усердно учился, получил высшее образование по лигвистике и филологии и затем остался преподавать и заниматься наукой в университете Гарварда.  По ходу своей карьеры он изобрел несколько законов, описывающих статистические показатели частоты встречаемости определенных слов в любых человеческих языках, позже эти законы назвали его именем, законами Зипфа.

Суть законов Зипфа:

В каждом языке есть слова, которые встречаются чаще, чем остальные, но не имеют значения. Есть слова, которые встречаются реже, но имеют намного большее смысловое значение.

 

Первый закон Зипфа "ранг - частота". Выбирается любое слово и подсчитывается, сколько раз оно встречается в тексте. Эта величина называется частота вхождения слова. Измеряется частота каждого слова текста. Некоторые слова будут иметь одинаковую частоту, то есть входить в текст равное количество раз. Сгруппируем их, взяв только одно значение из каждой группы. Расположим частоты по мере их убывания и пронумеруем. Порядковый номер частоты называется ранг частоты. Так, наиболее часто встречающиеся слова будут иметь ранг 1, следующие за ними -- 2 и т.д. Вероятность встретить слово путем случайного выбора, будет равна отношению частоты вхождения этого слова к общему числу слов в тексте.

Вероятность = Частота вхождения слова / Число слов.

Зипф обнаружил интересную закономерность. Оказывается, если умножить вероятность обнаружения слова в тексте на ранг частоты, то получившаяся величина (С) приблизительно постоянна!

С = (Частота вхождения слова х Ранг частоты) / Число слов.

Если немного преобразовать  формулу, то можно увидеть, что это функция типа y=k/x и ее график - равносторонняя гипербола. Следовательно, по первому закону Зипфа, если самое распространенное слово встречается в тексте, например, 100 раз, то следующее по частоте слово вряд ли встретится 99 раз. Частота вхождения второго по популярности слова, с высокой долей вероятности, окажется на уровне 50.

Значение константы в разных языках различно, но внутри одной языковой группы остается неизменно, какой бы текст мы ни взяли. Так, например, для английских текстов константа Зипфа равна приблизительно 0,1. Русские тексты с точки зрения законов Зипфа не исключение. Для русского языка коэффициент Зипфа получился равным 0,06-0,07.

Второй закон Зипфа "количество - частота". Рассматривая первый закон, факта, что разные слова входят в текст с одинаковой частотой не рассматривался. Зипф установил, что частота и количество слов, входящих в текст с этой частотой, тоже связаны между собой.

Если построить график, отложив по одной оси (оси Х) частоту вхождения слова, а по другой (оси Y) -- количество слов в данной частоте, то получившаяся кривая будет сохранять свои параметры для всех без исключения созданных человеком текстов! Как и в предыдущем случае, это утверждение верно в пределах одного языка. Однако и межъязыковые различия невелики. На каком бы языке текст ни был написан, форма кривой Зипфа останется неизменной. Могут немного отличаться лишь коэффициенты, отвечающие за наклон кривой (в логарифмическом масштабе, за исключением нескольких начальных точек, график - прямая линия).

Законы Зипфа универсальны. В принципе, они применимы не только к текстам.  Характеристики  популярности  узлов в сети Интернет - тоже отвечают законам Зипфа. Не исключено, что в законах отражается "человеческое" происхождение объекта.

C помощью законов Зипфа можно извлечь слова, отражающие смысл текста. Если воспользоваться первым законом Зипфа и построить график зависимости ранга от частоты, то исследования показывают, что наиболее значимые слова лежат в средней части диаграммы. Слова, которые попадаются слишком часто, в основном оказываются предлогами, местоимениями, в английском - артиклями и т.п. Редко встречающиеся слова тоже, в большинстве случаев, не имеют решающего смыслового значения.

От того, как будет  выставлен диапазон значимых слов, зависит многое. Поставив широко - нужные термины потонут в море вспомогательных слов; установив узкий диапазон - потеряются смысловые термины. Каждая поисковая система решает проблему по-своему, руководствуясь общим объемом текста, специальными словарями и т.п.

Если проанализировать выделенную область значимых слов, то можно отметить, что не все слова, которые попали в нее, отражают смысл текста. Эти слова являются "шумом", помехой, которая затрудняет правильный выбор. "Шум" можно уменьшить путем предварительного исключения из исследуемого текста некоторых слов. Для этого создается словарь ненужных слов - стоп-слов (словарь называется стоп-лист). Например, для английского текста стоп-словами станут термины: the, a, an, in, to, of, and, that... и так далее. Для русского текста в стоп-лист могли бы быть включены все предлоги, частицы, личные местоимения и т. п. Наверняка попали бы и слова из нашего "шума": на, не, для, это. Есть и другие способы повысить точность оценки значимости терминов .

 

 

 

 

 

 

 

 

 

 

 

 

Библиографический список

 

  1. Бройдо В.Л. Вычислительные системы, сети и телекоммуникации: Учеб. пособ. для вузов / В.Л. Бройдо.- СПб.: Питер, 2003.- 688 с.
  2. http://www.itstan.ru/poiskovye-sistemy/zakony-zipfa
  3. http://ru.wikipedia.org

 


Информация о работе Система IP-адресов.Законы Зипфа