Средства поиска информации в сети Internet. Технология поиска информации

Автор: Пользователь скрыл имя, 30 Ноября 2011 в 16:06, контрольная работа

Краткое описание

Сегодня каждый день множество людей неожиданно открывает для себя существование глобальных компьютерных сетей, объединяющих компьютеры во всем мире в едином информационном пространстве, имя которому - Интернет. Интернет многогранен и нельзя четко определить, что это такое. С технической точки зрения, Интернет - объединение транснациональных компьютерных сетей, работающих по самым разнообразным протоколам, связывающих всевозможные типы компьютеров, физически передающих данные по телефонным проводам и оптоволокну, через спутники и радиомодемы. Сегодня практически любой человек, обладающий доступом к компьютеру с простейшим модемом, может использовать в своей деятельности огромные информационные ресурсы, предоставляемые Интернет.

Оглавление

Введение 3 - 5
Технология поиска информации в Интернете 6 - 11
Приемы эффективного поиска 12 - 20
Прикладное значение. Лучший поисковик. 21 - 29
Заключение 30 - 32
Список литературы 33

Файлы: 1 файл

готовая информатика.doc

— 881.00 Кб (Скачать)

     Всякий  раз, когда "паук" находит очередную Web-страницу, составитель индекса (indexer) изучает содержимое, занося слова, найденные в ссылках и тексте страниц, в гигантскую базу данных, уплотнить базу и очистить ее от повторяющихся элементов можно с помощью высокоэффективных алгоритмов строения баз данных, заложенных в составитель индекса. Это несложно, ведь в человеческой речи пока не используются уникальные слова. Составитель индекса должен в итоге создать базу, в которой URL адреса были бы соотнесены с наборами встречающихся в них слов.

     Если  какую-либо Web-страницу не удается найти, это еще не значит, что такой  страницы не существует. Многие поисковые системы генерируют списки, в которых родственные темы собраны в разделы, организованные по принципу каталогов (такой принцип заложен, например, в Yahoo!). Если вам не удается найти нужные материалы - скажем, об уходе за йоркширским терьером (grooming Yorkshire Terrier), попробуйте отыскать их по индексу. Вполне возможно, искомая тема обнаружится среди его ссылок.

     Чтобы повысить эффективность поиска по индексу, сделайте условие поиска более общим  и добавьте ключевое слово "index". Так, условие Grooming AND (Yorkie OR "Yorkshire Terrier") следует изменить на Index AND (Yorkie OR Yorkshire). He исключено, что менее конкретное условие Index AND Terrier даст еще лучшие результаты. Если условие выбрано удачно, поисковая система возвратит один или несколько индексов, ссылающихся на страницы о йоркширской породе и терьерах.

1.4. Составители  каталогов.

     На  первый взгляд отличить программы индексирования от составителей каталогов трудно. Материя для поиска для обоих  инструментов служит содержимое Web-страниц.

     Однако, в отличие от программ индексирования, составители каталогов не разыскивают  все Web - страницы Internet. Объектом поиска для них являются адреса URL, которые  включаются в систематизированный  каталог. Поиск по каталогу можно  проводить как с помощью броузера, так и вручную, щелкая на названиях разделов и знакомясь с их содержимым.

     Тем не менее, несмотря на принципиальные различия в механизмах работы, грань  между граммами индексирования и  составления каталогов постепенно стирается. Все чаще можно встретить индекс, снабженный средствами построения каталога. Нередко сами Web-страницы в верхней части имеют некое подобие содержания со ссылками на отдельные разделы. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    ПРИЕМЫ  ЭФФЕКТИВНОГО ПОИСКА 

     Разные  методики поиска, приводят к различным результатам. Последние, к примеру, зависят от того, какой булев оператор использован в ключевом выражении. Ниже приведено несколько основных правил подбора ключевых слов.

• Чем  конкретнее понятие, обозначаемое ключевым словом, тем лучше. Это сужает область поиска и делает его более предметным. К примеру, не следует вводить слово "dog" (собака), если нельзя поискать сведения о карликовом пуделе.

• Избегайте  общеупотребительных слов. В качестве ключевых бесполезно использовать такие слова, как "that", "the", "program", "internet". Они настолько распространены, что поиск по ним даст многие тысячи страниц.

• Пробуйте разные формы одного ч того же ключевого  слова. Например, если искомые страницы должны содержать сведения о беге (running), пробуйте поиск по всем трем формам: "run", "runs", "running".

• Не забывайте  о синонимах. Так, кроме "running" (бег), можно использовать также "jog" (бег трусцой). В выражениях с булевыми операторами не забывайте разделять  синонимы оператором OR.

• Пробуйте разные варианты. Если найденных страниц оказалось слишком много, попробуйте сузить условие поиска. Напротив, если результат слишком скуден, используемое ключевое слово следует заменить более общим понятием. Первый выбор далеко не всегда оптимален.

• Не забывайте добавлять кавычки. Они обязательны, если ключевое слово или выражение представляет собой название. Например, чтобы найти в Internet упоминание об этой книге, в строке для ключевых слов нужно ввести: "Special Edition Using the Internet". He забудьте поставить кавычки.

• Учитывайте регистр символов. Результат поиска нередко зависит от того, в каком  регистре записано ключевое слово. Так, если оно записано строчными буквами, программа возвращает страницы, где  это выражение записано как строчными, так и прописными. Однако если в строку для поиска ввести прописные символы, регистр будет строго соблюден: программа найдет только те страницы, где это выражение целиком записано прописными.

• Обращайте  внимание на специфику используемого  инструмента. Некоторые поисковые службы обладают свойствами, значительно облегчающими поиск нужных документов. В этой главе будет рассказано о самых популярных средствах; дополнительные сведения можно найти, щелкнув на ссылках в нижней части начальных страниц этих служб.

Если начальная страница службы поиска содержит перечень разделов (topic map), их рекомендуется использовать, так как они помогают в выборе ключевых слов. Перечень разделов содержит список дополнительных ключевых слов (основанный на словах, вводимых пользователем), которые программа рекомендует использовать в поиске, и перечень найденных источников.

     Использование в ключевых выражениях булевых операторов (AND, OR, NOT) в ключевых выражениях помогает уточнить область и предмет поиска. Хотя наличие заданных ключевых слов поисковая служба проверяет во всех без исключения документах Internet, условия поиска можно изменять, задавая способ комбинации нескольких ключевых слов. Например, условием поиска может быть "golf (гольф) в сочетании с "equipment" (снаряжение), "clubs" (клубы), "bags" (сумки), "balls" (мячи) - с одним из этих слов или со всеми одновременно в любых комбинациях.

     Булевы  операторы, которые можно использовать для составления ключевых выражений. Оператор AND между двумя ключевыми  словами задает поиск страниц, содержащих одновременно оба слова. По оператору OR будут найдены все страницы, содержащие по крайней мере одно из двух ключевых слов. Если перед ключевым словом стоит оператор NOT, служба поиска найдет страницы, в которых это ключевое слово отсутствует.

Булевыми  операторами можно объединять несколько  слов или выражении, взятых в кавычки. Ниже приводится несколько примеров.

• Music AND Celtic

Поиск страниц, содержащих оба слова - "Music" и "Celtic".

• Honeycutt AND Book AND NOT "Using the Internet"

Поиск страниц, содержащих слова "Honeycutt" и "Book", но не содержащих выражения "Using Internet".

• Honeycutt OR Que AND Book AND "Using the Internet"

Это условие  задает поиск страниц, каждая из которых  содержит хотя бы одно из двух ключевых слов - "Honeycutt" или "Que", а также слово "Book" и выражение "Using the Internet".

• Grooming AND "Yorkshire Terrier"

Поиск страниц, в каждой из которых содержится слово "Grooming" и выражение "Yorkshire Terrier" Границы поиска можно сузить, заключив часть условия с оператором в скобки.

• "Using the Internet" AND (Second OR Third)

Поиск всех страниц, каждая из которых содержит одно из двух слов ("Second" или "Third") и выражение "Using the Internet".

• (Grooming OR Care) AND (Yorkie OR Westie)

Поиск страниц, в которых содержится хотя бы одно слово из каждой пары: "Yorkie" - "Westie' "Grooming" - "Care".

• Search AND (Tool OR Index OR Directory)

Поиск страниц, содержащих слово "Search" в  сочетании с одним из слов "Tool", "Index" или "Director

     Некоторые средства поиска позволяют однозначно указывать системе, должны ли искомые страницы содержать то или иное ключевое слово. Для этого служат знаки "+" и "-", например +word, -word. 3i "+" показывает, что искомые страницы должны содержать данное ключевое слово, знак "-" задает noi страниц, в которых такое слово отсутствует. Ниже приводятся примеры использования включающих и ключающих символов в ключевых выражениях.

• +Honeycutt -Gerald +Jerry

     По  такому условию будут найдены  страницы, содержащие слова "Honeycutt" и "Jerry", но не держащие слова "Gerald".

• +Book-Plus

     Это условие определяет поиск страниц, содержащих слово "Book" и не содержащих слова "Pli Это выражение эквивалентно условию "Book AND NOT Plus".

2.1. Практические аспекты использования поисковых

сервисов  Интернет.

     Самым интересной чертой Интернет является ее полезность. В отличие от других перспективных технологий, использовать глобальную сеть можно уже сейчас. Условно говоря, объем информации, доступной Вам таким образом, гораздо больше доступной традиционными путями. Представление и удобство ее восприятия пока не могут сравниться с книгами или телевидением, но количество и доступность информации в сети несравненно выше. Далее в этой главе рассматриваются ситуации, в которых приводятся примеры использования Интернет в повседневной деятельности. Они призваны показать, что уже сегодня можно пользоваться информацией, доступной из сети, столь же легко и обыденно, как, скажем, телефоном. Дело здесь только в отношении к инструментам, находящимся в Вашем распоряжении. К сервисам Интернет (в первую очередь это касается World Wide Web) нужно просто привыкнуть и чувствовать, что они есть под рукой. Если Вам требуется некоторая информация, то, прежде, чем искать справочник или звонить коллеге, оцените, нельзя ли получить ту же информацию в Интернет. Это может оказаться самым скорым способом, да и вероятность найти нужную информацию больше. С другой стороны, сегодняшний мир стремительно изменяется, знания и данные накапливаются так быстро, что книги просто не могут успеть за ними. Интернет - источник наиболее свежей информации. Готовить и публиковать ее в электронном виде несравненно быстрее и дешевле, чем традиционными путями. Дальнейшие выводы сделать нетрудно. Если уже сегодня Ваше умение и привычка работать с информацией on-line влияют на скорость и эффективность Вашей работы, то завтра они могут стать определяющими факторами.

     Некорректным  было бы умолчать о слабых сторонах Интернет как источника информации. В первую очередь, надо иметь в  виду, что Интернет международная  сеть. Это значит, что 99 процентов  ее документов написаны на английском языке. Это не значит, что в Интернет нечего делать, не зная его. Эта статья, например, будет доступна в Интернет. Но хотя и существует некоторое количество русскоязычных серверов, их все же недостаточно, чтобы создать русскоязычную информационную среду. Конечно, знание английского языка сегодня становится критерием общей грамотности, но мы ведем разговор об информации, ее получении и усвоении. Документ на родном языке читается и воспринимается гораздо быстрее. Так или иначе, тотальная англоязычность Интернет имеет не только плюсы, но и минусы.

Во-вторых, Интернет - компьютерная сеть, и информация в ней чаще компьютерного плана. Если Вас интересуют компьютеры, Вы наверняка найдете то, что ищете. Если Вы ищете кулинарные рецепты, то вероятность их обнаружения в сети гораздо ниже. Другими словами, насыщенность Интернет информацией неравномерна для различных областей человеческой деятельности. Хотя реально не проводилось никаких исследований такого рода, но можно предположить, что примерно две трети Интернет относятся к компьютерам, около трети - к развлечениям (включая новости, спорт, магазины и т.д.), и лишь малая доля ко всему прочему. Такая направленность ограничивает сегодняшнюю применимость сети, и это надо иметь в виду.

     В большинстве нижеописанных примеров будут использоваться ссылки и документы WWW. Это объясняется тем, что World Wide Web - интегрирующая система, позволяющая обращаться через себя к большинству сервисов Интернет.

2.2. Составление ссылки из имени организации.

     Предположим, вы хотите узнать что-то о некоторой американской компании, известной Вам только по имени, например Applix. Неважно, что именно Вас интересует - телефоны, новости, продукты компании - первое, что нужно сделать в такой ситуации - попробовать обратиться по ссылке http://www.applix.com. Вы заметили соответствие? Обратившись по ссылке http://www.имя_компании.com, Вы с большой вероятностью попадете на WWW-сервер искомой компании. Это относится не только к компьютерным компаниям. Так, адрес WWW-сервера компании Walt Disney - http://www.disney.com/, а сервера химической компании Dow - www.dow.com. В таком имени окончание com значит, что это сервер коммерческой компании, расположенной в США. Серверы правительственных организаций США имеют окончание gov(например, www.whitehouse.gov), а серверы некоммерческих организаций - org, как-то www.greenpeace.org. Если Вас интересует не американская организация, попробуйте добавить в качестве окончания аббревиатуру страны - at для Австрии, de для Германии, ru для России. Этот очень простой метод поиска организаций может оказаться весьма полезным.

Информация о работе Средства поиска информации в сети Internet. Технология поиска информации