Средства поиска информации в сети Internet. Технология поиска информации

Автор: Пользователь скрыл имя, 30 Ноября 2011 в 16:06, контрольная работа

Краткое описание

Сегодня каждый день множество людей неожиданно открывает для себя существование глобальных компьютерных сетей, объединяющих компьютеры во всем мире в едином информационном пространстве, имя которому - Интернет. Интернет многогранен и нельзя четко определить, что это такое. С технической точки зрения, Интернет - объединение транснациональных компьютерных сетей, работающих по самым разнообразным протоколам, связывающих всевозможные типы компьютеров, физически передающих данные по телефонным проводам и оптоволокну, через спутники и радиомодемы. Сегодня практически любой человек, обладающий доступом к компьютеру с простейшим модемом, может использовать в своей деятельности огромные информационные ресурсы, предоставляемые Интернет.

Оглавление

Введение 3 - 5
Технология поиска информации в Интернете 6 - 11
Приемы эффективного поиска 12 - 20
Прикладное значение. Лучший поисковик. 21 - 29
Заключение 30 - 32
Список литературы 33

Файлы: 1 файл

готовая информатика.doc

— 881.00 Кб (Скачать)

ФГОУ  ВПО «Омская академия Министерства внутренних дел РФ»

Факультет права и экономики

Кафедра юридических дисциплин 

 
 
 

КОНТРОЛЬНАЯ РАБОТА 

ПО ДИСЦИПЛИНЕ: 

«ИНФОРМАТИКА  И МАТЕМАТИКА» 

ТЕМА  №17: 

Средства  поиска информации в  сети Internet.

Технология  поиска информации. 
 
 
 
 
 
 
 

Выполнила: студентка 1 курса, гр. ЗУСЮ-11,

                                                   Кравченко Е.И.

                                                       

                                                        Проверил: к.т.н., доцент         Гаврилов А.В.  
 
 
 
 
 

Омск 2009

Содержание: 

Введение                                                                                                           3 - 5

Технология поиска информации в Интернете                 6 - 11

Приемы эффективного поиска                12 - 20

Прикладное  значение. Лучший поисковик.                                                 21 - 29

Заключение             30 - 32

Список литературы             33 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

ВВЕДЕНИЕ 

     Сегодня каждый день множество людей неожиданно открывает для себя существование глобальных компьютерных сетей, объединяющих компьютеры во всем мире в едином информационном пространстве, имя которому - Интернет. Интернет многогранен и нельзя четко определить, что это такое. С технической точки зрения, Интернет - объединение транснациональных компьютерных сетей, работающих по самым разнообразным протоколам, связывающих всевозможные типы компьютеров, физически передающих данные по телефонным проводам и оптоволокну, через спутники и радиомодемы. Сегодня практически любой человек, обладающий доступом к компьютеру с простейшим модемом, может использовать в своей деятельности огромные информационные ресурсы, предоставляемые Интернет.

     Итак, Интернет - сеть сетей, всемирная компьютерная сеть. Интернет можно рассматривать с многих позиций, вот две крайние из них. Наиболее узкое рассмотрение - объединение сетей, связанных между собой так, что в любой момент каждый компьютер в Интернет "видит" каждый другой (то есть может передать ему пакет данных и получить ответ за доли секунды). Наиболее широкое - киберпространство, рождающее киберкультуру со своим образом мысли, своим языком, своей этикой.

     Интернет  замечателен тем, что сеть и ее сервисы стали широко распространены в жизни общества, что они оказались достаточно хороши, чтобы река информации потекла руслом Интернет. Интернет не решил проблему хранения и упорядочения информации, но решил проблему ее передачи - дал возможность получить любую информацию где угодно, когда угодно.

     Эта замечательная способность передачи информации привела к грандиозным темпам роста Интернет. Вследствие децентрализованности, нельзя точно сказать, каковы его размеры сегодня, но по оценкам "Network Wizards", количество компьютеров, полноценно подключенных в Интернет, последние два года ежегодно удваивается, составляя 6,6 миллионов компьютеров в июле 1995 года. По другим оценкам, количество компьютеров, имеющих доступ к каким-либо сервисам Интернет, весной 1995 года составляло до 30 миллионов. Это значит, что если скорость роста Интернет останется на том же уровне, то в течение ближайших лет Интернет и его сервисы станут столь же общеупотребительными, как телефон и телевидение сегодня. Очень многие компании понимают это, и, стремясь первыми прийти на этот рынок (а Интернет представляет собой, помимо всего прочего, еще и огромный рынок миллионов потенциальных клиентов), вкладывают деньги в развитие сети и сервисов, ей предоставляемых. Если в 1994 году в компании, работающие с Интернет, было вложено 42 миллиона долларов США, то уже за первый квартал 1995 года эта цифра составляла 47 миллионов (New York Times, 26 June 1995, p. D5). А деньги, как известно, делают деньги, и это является еще одним фактором, ускоряющим развитие сети. Коммерциализация Интернет - это, возможно, самый важный аспект его развития сегодня. Долгое время, до весны 1995 года, основные каналы связи и административные структуры Интернет финансировались Национальным научным фондом США, но теперь финансирование прекращено и развитие сети происходит на коммерческой основе.

     Чтобы жить в городе, нужно уметь пользоваться транспортом. Для каждой поездки  выбирают свой вид транспорта. За город  ездят на электричках, в аэропорт можно поехать на маршрутном такси, до метро можно доехать на троллейбусе. Интернет в этом плане очень похож на город. Чтобы успешно работать с ним, нужно знать правила поведения в сети и уметь ориентироваться в множестве доступных Вам информационных сервисов. Увы, ввиду децентрализованности и молодости Интернет, не существует единой его карты или путеводителя по всем его сервисам. Эффективность работы в сети определяется знанием существующих сервисов, умением обращаться с конкретными сервисами и способностью выбрать правильный способ решения конкретной задачи. Этим определяется не только то, как скоро можно найти нужную информацию, но и то, можно ли ее найти вообще.

     Сегодня Интернет объединяет множество разных сетей, миллионы компьютеров, около 300 миллионов пользователей (данные от Robert Orenstein) всех континентов и, по разным оценкам, число таких пользователей увеличивается на 15-80% ежегодно. Можно выделить два основных направления в использовании Интернет в бизнесе. Это оперативный доступ к поистине необозримым кладезям информации по любой тематике (на сотнях тысяч информационных серверов), поиск и интерактивное общение с партнерами, практически в любой специализации и географическом расположении. Как сориентироваться в столь масштабном информационном пространстве? Для этого существуют специализированные поисковые сервера. Их можно разделить на тематические каталоги, роботы индексов (поисковые машины), системы мета поиска. Также, для поиска необходимой информации в Интернет весьма полезны системы поиска в конференциях Usenet и службы поиска людей.  
 
 
 
 
 
 
 
 
 
 
 
 

    ТЕХНОЛОГИЯ  ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ 

      Сегодня Интернет объединяет множество разных сетей, миллионы компьютеров, около 300 миллионов пользователей (данные от Robert Orenstein) всех континентов и, по разным оценкам, число таких пользователей  увеличивается на 15-80% ежегодно. Можно  выделить два основных направления в использовании Интернет в бизнесе. Это оперативный доступ к поистине необозримым кладезям информации по любой тематике (на сотнях тысяч информационных серверов), поиск и интерактивное общение с партнерами, практически в любой специализации и географическом расположении. Как сориентироваться в столь масштабном информационном пространстве? Для этого существуют специализированные поисковые сервера. Их можно разделить на тематические каталоги, роботы индексов (поисковые машины), системы мета-поиска. Также, для поиска необходимой информации в Интернет весьма полезны системы поиска в конференциях Usenet и службы поиска людей.

     Стандартная технология поиска информации, реализованная, например, в протоколе Gopher, основывается на "деревьях". Примером реализации этой технологии могут служить также индексные файлы систем управления базами данных - "бинарные деревья". В тех случаях, когда поиск осуществляется автоматически на основе строгого алгоритма выбора дальнейшего пути поиска, технология, основанная на "деревьях" обеспечивает наилучшие результаты. Но в тех случаях, когда выбор осуществляет человек, не совсем ясно представляющий что он ищет, такой способ поиска часто будет приводить в тупики т.е. к информации не полной или вообще в данный момент не нужной. В таких случаях поиск приходится начинать сначала.

     Основная  идея, реализованная в технологии WWW(World Wide Web), состоит в том, чтобы  каждый объект поиска имел ссылки на ассоциативно связанные с ним объекты. Причем в сети Internet такие ссылки может определять любой пользователь сети. В этом случае поиск не может закончиться тупиком и нужная информация может быть найдена при движении по разным путям. Такая система поиска больше напоминает паутину, чем дерево и именно эта ассоциация лежит в основе названия технологии WWW - "всемирная паутина".

      Технология WWW была разработана в Европейском  центре ядерных исследований (CERN) и  основывается на архитектуре клиент/сервер. Программа броузер выполняет  роль клиента, с ее помощью можно  соединиться с программой-сервером (Web- страницей), находящейся в любом месте сети Internet. При нахождении необходимой информации, она передается программе-клиенту. При отсутствии нужной информации программе-клиенту передаются ссылки на другие серверы и так до тех пор, пока искомые сведения не будут найдены.

     Web содержит миллионы документов, однако  прямой доступ возможен лишь  к тем немногим источникам, на  которые есть ссылки на открытой  в данный момент странице. При  этом подавляющее число документов Web остается вне поля зрения. Чтобы исправить подобную ситуацию, предусмотрительные программисты разработали целый ряд служб, в которые заложен тот или иной метод поиска документов, не имеющий прямых ссылок.

1.1. Поисковые  службы.

     Общим подходом для всех служб является поиск по заданным пользователем ключевым словам. Наличие заданных ключевых слов проверяется в теле документа, его заголовке или ссылках. В ходе поиска формируется Web-страница результатов, содержащая адреса URL, названия и краткие описания найденных источников. Общая последовательность работы со всеми службами одинакова.

1. Откройте  начальную страницу службы.

2. Введите  ключевые слова для поиска  и нажмите . Программа возвращает Web-страницу с первой группой  найденных источников, удовлетворяющих  условиям поиска.

3. Обнаружив  в списке нужный источник, щелкните  на ссылке. Броузер откроет соответствующую  Web-страницу.

     По  способу поиска и организации  результатов все программы поиска можно разбить на две группы. Системы  индексирования (search index) проводят поиск по заданным пользователем ключевым словам. Составители каталогов (search directory) организуют Web-страницы в систему иерархически связанных разделов. Способов поиска в такой системе много, включая перемещение по ссылкам от разделов высшего к разделам низших уровней. И те, и другие выводят результаты, используя базу данных, которую составляют, периодически совершая рейды по сети.

1.2. Что  такое поисковые индексы и  каталоги.

     Индекс  используется для поиска Web-страниц  по ключевым словам, каталог - по разделам, систематизированным по иерархическим рубрикам.

     Броузеры  имеют встроенные средства поиска документов

И NetScape Navigator, и Microsoft Internet Explorer имеют встроенные средства, позволяющие быстро находить нужные страницы.

     Поисковая система - мощный инструмент, позволяющий узнавать обо всем на свете: от результатов последних спортивных матчей до ежедневных происшествий. Благодаря правильно организованному средству поиска Web становится неотъемлемой частью повседневной жизни пользователя.

     PointCast Client - одна из лучших поисковых систем, позволяющая получать последние новости прямо на рабочий стол компьютера. А главное, она абсолютно бесплатная!

     Возможности мощных систем поиска выходят далеко за пределы простого умения находить Web-страницы. Многие из них имеют встроенные средства поиска адресов электронной почты, телефонных номеров и сообщений групп новостей. Некоторые позволяют находить географические карты, например, подробные планы городов.

1.3. Индексы.

     Появление индекса является результатом работы трех элементов программы индексирования. Схема взаимодействия между ними представлена на рис. 1. Собственно поиск по ключевым словам выполняет поисковая система (search engine). Именно к этой части программы индексирования обращается пользователь, задавая условие поиска в строке для ключевых слов. Поиск проходит в организованной программой базе данных. Совокупность найденных ссылок и адресов URL оформляется в виде Web-страницы результатов. Системы различаются своими возможностями. Некоторые из них поддерживают использование ключевых выражениях булевых операторов, позволяя существенно сузить область поиска. Другие, напротив, собирают всё, что содержит по крайней мере одно из заданных ключевых слов.

     Поисковая система - единственный элемент программы  индексирования, с которым пользователь взаимодействует непосредственно.

"Паук " (spider) (иногда называемый также  "червем" (worm) или "гусеницей" (crawler)) должен выявить как можно  больше Web-страниц. Для этого он "запоминает" все ссылки на  открытые им документы. В обнаруженных таким образом новых страницах вновь отыскиваются и запоминаются ссылки. Эта процедура повторяется до тех пор, пока не будут исчерпаны все источники ссылок. Однако очевидно, что подобный метод не может гарантировать всеобъемлющих результатов: попадет ли тот или иной источник в число собран "пауком" страниц, целиком зависит от наличия ссылок на него в других документах Web.

Информация о работе Средства поиска информации в сети Internet. Технология поиска информации