Информационно-поисковые системы

Автор: Пользователь скрыл имя, 28 Февраля 2013 в 14:19, реферат

Краткое описание

Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.
В данной курсовой работе рассматриваются теоретические основы информационного поиска, классификация и разновидности информационно поисковых систем. Представлен материал по применяемым в настоящее время информационно – поисковым каталогом полнотекстовыми и гипертекстовым поисковым системам.

Оглавление

Введение ……………………………………………………………………3
Информационные системы…………………………………….4
Понятие информационных систем………………………………………4
Структура информационных систем……………………………………4
Классификация информационных систем……………………………..6
Информационно поисковые системы…………………………7
Исторические предпосылки развития поисковых систем……………7
Понятие поисковых систем…………………………………………….....9
Особенности поисковых систем…………………………………………10
структура сети…………………………………………………....11
структура работы поисковых систем……………………….....13
Характеристика поисковых систем……………………………17
проблемы и возможности поисковых систем…………………24
Заключение………………………………………………………………….25
Список литературы………………………………………………………...26

Файлы: 1 файл

Д.Г. 275гр.docx

— 76.91 Кб (Скачать)

 

Характеристика  поисковых систем.

 

Начиная поиск чего-либо в Internet и имея минимум информации, а так же пытаясь огранить потери времени, для получения наиболее общей информации возможно обращение к следующей базе данных.

База данных: предмет ведет  к Межсетевым ресурсам, построенным  библиотекарями.

Содержание: Свыше 2,500 связей с Internet ресурсами, кратко аннотируемыми, с указанными предметными заголовками.

Поиск: Поиски могут быть ограничены названием ресурса, описанием  его, или с указанными предметными  заголовками.

Результаты: Результаты показаны в алфавитном порядке названиями ресурса.

Адрес: http://sunsite.berkeley.edu/InternetInd ex/

Частота Модернизации: ежедневно

 

Yahoo!

Yahoo! – самая известная поисковая машина. Её сайты разбиты по категориям и ключевым словам. Она содержит полезную информацию на своей домашней странице. Может подключаться к другим поисковым машинам

Базы данных: в ведении  находится служба поиска Internet-ресурсов, новостей, карт, рекламных информаций, спортивная информация, бизнес, номера телефонов, персональные WWW-страницы, и email-адреса (отдельная база данных).

Содержание: Основная директория содержит: адреса (URLs) для Internet-ресурсов и краткое описание для этих связей.

Поиск: Все Yahoo страницы предлагают не только простое поисковое окно, но и опции для этого поиска, а так же поиск Usenet или Email-адреса. Поиск может ограничиваться указанием определённого промежутка времени. Boolean операторы (и, или) и последовательный поиск также поддержаны. Отметим: если поиск в Yahoo! не привёл к положительному результату, то процесс поиска автоматически переходит на AltaVista, которая продолжает поиск, и в случае положительных результатов автоматически возвращает найденную информацию в Yahoo!.

Если Yahoo! не может установить связь достаточно быстро с AltaVista, то в этом случае Yahoo! будет обеспечивать страницу связи с набором инструментов поиска. После того как одна из этих связей выбирается, ключевые слова передаются к поисковой машине на ваше усмотрение.

Средством, облегчающим поиск, является наличие “tipsearch”(TS) - поиск с помощью “намека”: Yahoo! Является подчиненным справочником, что означает, что система не имеет так много страниц, как поисковые машины, однако задание наиболее общих ключевых слов позволит найти необходимую тему на странице высокого уровня (первая страница, которая возникает перед пользователем при посещении сайта) для организации или компании.

Результаты: Связи отображаются в соответствии с очерёдностью задаваемых слов последовательностью поиска наряду с их описательным текстом и подчиненной  иерархией.

Адрес: http://www.yahoo.com/

Частота Модернизации: ежедневно

 

AltaVista

AltaVista поддерживает поиск по ключевому набору слов и для определения языка конкретной страницы использует методы искусственного интеллекта. Пользователи могут настроить опции поиска и выбирать тип поиска – сложный или упрощенный, а также воспользоваться различными способами предоставления информации. В отличие от машин, которые индексируют только ключевые слова, она индексирует весь текст, что позволяет осуществлять полный поиск. Однако из - за этого пользователь может просто утонуть в информации.

Базы данных: Расположенные  по всему миру WWW-страницы и UsenetNews (новости).

Содержание: 31 миллион WWW-страниц (на май 1997 г.) и полный текст более  чем 14,000 newsgroups обновленный в реальном масштабе времени.

Поиск: Предлагает простой(simple (S)) поиск или (muchmoreadvanced (MMS)),т.е. более передовой, способ. S - поиск стоит в основном использовать для общих вопросов, MMS - поиск использует специфический поисковый синтаксис. Для облегчения выполнения процедуры имеется подсказка(SimpleSearchHelp). MMS - поиск, используя булинь(boolean), т.е. с помощью ключевых союзов, используя (and, or, not - (и, или, не)) и простую смежность (near - (около)) позволяет употреблять несколько слов, чередование слов, словосочетание в качестве ключевых для проведения поиска.

TS - поиск: Введением ключа  типа: " Ваша Фраза " как первое  направление поиска, который будет  ограничивать число найденных  WWW - документов с заголовками  типа " Ваша Фраза ".

Результаты: Предлагает три  выбора результатов (но два дают тот  же самый результат):

1) "Стандартные"("Standard") - результаты, полученные машиной в виде списка параграфов, резюмируемые ей, с наличием URL - адреса, размером файла и последней датой модернизации. Результаты возвращаются как десять пунктов на экране,

2) "Компактный"("Compact") помещают каждый пункт в одной строке с последней датой модернизации картотеки,

3) "Детальный"("Detailed"), который является таким же самым, как и "Стандартный".

Адрес: http://altavista.digital.com

Частота модернизации: Постоянно WWW-роботом.

 

Excite

Для анализа информации Excite использует поисковую технологию IntelligentConceptExtraction, что позволяет делать запросы по образцу. Это самая популярная поисковая система в Америке. Для каждой найденной страницы она оценивает степень соответствия запросу.

Базы данных: WWW-страницы по всему миру, новости, карты, "yellowpages" ("желтые страницы"), свободно распространяемое программное обеспечение, основные цитаты, программы телевидения, погоду, E - mail адреса, рейсы авиалиний.

Содержание: 50 миллионов WWW-страниц  и больше чем двухнедельный запас  Usenet новостей.

Поиск: Предлагает только S - поиск, который поддерживает некоторые  опции MMS - поиска.

TS - поиск: используйте  плюс (+) чтобы определить, что все документы имеют данное слово, или используют минус (-) что бы уточнить, что ни один из документов не имеет данного слова. Возможно так же поддержка вoolean-операторами.

Вы можете использовать "AND", "OR" and "AND NOT"(И, ИЛИ и. И НЕ) операторы и круглые скобки для группировки. Например: (digitalorvirtualorelectronic) AND library.

(цифровойили виртуальный или электронный) И библиотека.

Результаты: Результаты показаны с названием документа, разряд уместности в процентах, URL - адрес, резюме программного обеспечением документа, и опция, чтобы  восстановить "MoreLikeThis"(" Скорее Этот "), которая позволяет использовать документ как ваш вопрос.

Адрес: http://www.excite.com/

Частота Модернизации: Постоянно - WWW-роботом.

 

HotBot

Для поиска в Интернете  использует многопроцессорную параллельную обработку 10. млн. страниц ежедневно. Полезная сторона HotBot ограничение на тип страниц по средствам выбора кнопок.

База данных: Расположенные  по всему миру WWW-страницы.

Содержание: 54 миллиона WWW-страниц (на сентябрь 1996 г.).

Поиск: Предлагает S - поиск  и Эксперт(Expert (Е))- поиск, поддерживает boolean-операторы (И и ИЛИ), поиск фразы, и выбор " человек "или" URL ". Е-поиск также поддерживает задание даты, местоположение (страна и т.д.)

TS - поиск: использует заключение  фразы в двойные кавычки (например, " слова фразы ").

Результаты: Результаты показаны с названием документа, разряд уместности в проценте, URL, размер документа.

Адрес: http://www.hotbot.com/

Частота модернизации: Постоянно WWW-роботом ("Slurp").

 

Infoseek

Infoseek самая популярная поисковая машина в компьютерной индустрии. В мае 1996 она была признана как самая достоверно предоставляющая информацию машина. Привлекательность машины в том, что после отсеивания информации можно проверить найденную информацию ещё раз.

Базы данных: расположенные  по всему миру WWW-страницы, новости, запасает цитаты, карты, желтые страницы("yellowpages"), e mail адреса, и т.д.

Содержание: Главный база данных: 50 миллионов URL-адресов. (на сентябрь 1996 г.)

Поиск: предлагает только простой S - поиск, но ключевые слова поиска могут  быть ограничены специфическими полями (типа в пределах заголовков документа), поиск с использованием возможностей либо с исключением определённого  слова (данному слову предшествует минус"-") или с включением требуемого слова (данному слову предшествует " + "). Для дополнительной информации относительно выбора поиска, используется. Infoseek-Помощь(InfoseekHelp).

Результаты: Включает название документа, размер картотеки, URL, краткое  резюме, извлеченное из документа, и  разряд уместности в процентах.

Адрес: http://www.infoseek.com/

Частота Модернизации: Постоянно WWW-роботом.

Дополнительная информация: в случае большого количества информации см. http://info.infoseek.com/.

 

Lycos

Lycos – одна из первых поисковых машин. Машина удобна для работы с поиском и для одновременного просмотра сайтов. При выводе информации показывает краткий обзор, и найденные адреса.

Базы данных: расположенные  по всему миру WWW-страницы, звуки, картины, "top 5% sites"

Содержание: 70 миллионов URL-адресов (на март 1997г.).

Поиск: предлагает S - поиск  и клиентурный(Custom (С)) поиск. С-поиск поддерживает boolean-операторы AND и OR (И и ИЛИ), также как некоторые другие назначения.

Результаты: результаты внесены  в упорядоченный список; информация включает адрес документа (URL), название, размер файла, и выдержки из файла.

Адрес: http://www.lycos.com/

Частота модернизации: постоянно WWW-роботом.

 

ПРОБЛЕМЫ И ВОЗМОЖНОСТИ  ПОИСКОВЫХ СИСТЕМ.

Работа многих поисковых  машин считается вполне успешной. Однако все современные поисковые  системы страдают некоторыми серьёзными недостатками:

    1. поиск по ключевым словам даёт слишком много ссылок и многие из них бесполезны.
    2. огромное количество поисковых машин с разными пользовательскими интерфейсами порождает проблему когнитивной перегрузки.
    3. методы индексирования баз данных, как правило, не связаны с информационным содержанием.
    4. часто выдаются ссылки на информацию, которой в Интернете уже давно нет.
    5. машины ещё не столь совершены, чтобы понимать естественный язык

в последнее время потребности  в интеллектуальной помощи быстро растут. Это привело к появлению интеллектуальных агентов.

Обычно интеллектуальные агенты являются основной частью поисковой машины для поиска используется искусственный интеллект. Пользователь учит агента, а затем он выходит в Интернет для поиска.

Интеллектуальные агенты выполняют инструкции от имени пользователя, имеют некоторую самостоятельность. После поиска они оповещают пользователя о результатах. Агенты учатся в результате своей деятельности.

Интеллектуальность –  обучение на основе обратной связи  по примерам ошибкам и по средствам  взаимодействия с другими агентами.

Простота использования  – можно тренировать агента используя естественный язык.

Индивидуальный подход –  адаптация к предпочтениям пользователей.

Интегрированность – непрерывное  обучение применение уже имеющих  знаний к новым ситуациям.

Автономность – ощущение окружающей среды, и анализ выводов.

 

ЗАКЛЮЧЕНИЕ.

Рассмотренные мною поисковые  машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

      1. простота в использовании
      2. чётко организованный и обновляемый индекс.
      3. быстрый поиск в базе данных и быстрое реагирование.
      4. надёжность и точность результатов поиска.

Масштабы информационных ресурсов и их количество постоянно  расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты – новое направление лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.

Информационные системы, в которых представлены хранение, и обработка информации осуществляются с помощью вычислительной техники, называют автоматизированными, различные  виды деятельности и наиболее буро развивающиеся отраслью индустрии  информационных технологий.

 

Список  литературы.

        1. Э.А. Якубайтис «Информатика-электроника-сети». М., «Финансы и статистика», 1989.
        2. . А. В. Гаврилов "Локальные сети ЭВМ", Москва, Изд-во "Мир", 1990.
        3. Н.А. Гайдамакин «Автоматизированные информационные системы, базы и банки данных», М.: «Гелиос», 2002.

Информация о работе Информационно-поисковые системы