Поисковая система Апорт

Автор: Пользователь скрыл имя, 09 Января 2012 в 19:05, контрольная работа

Краткое описание

Основные протоколы, используемые в Интернет (в дальнейшем также Сеть), не обеспечены достаточными встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся в ней. Протокол HTTP, используемый в Интернет, хорош лишь в отношении навигации, которая рассматривается только как средство просмотра страниц, но не их поиска.

Оглавление

Введение 3
Структура справочно-поисковых систем сети интернет 4
История создания поисковой системы Апорт 8
Особенности поисковой системы 9
Управление индексированием в поисковой системе Апорт 10
Добавление страниц в поисковой системе Апорт 10
Индексация ресурсов поисковой системой Апорт 10
Преимущества поисковой системы 12
Виды поиска 12
Простой поиск 12
Специальный поиск 13
Популярные сервисы «Апорт» 13
Апорт-лайт 13
Апорт – справка 14
Заключение 15

Файлы: 1 файл

поисковая система Апорт.doc

— 104.50 Кб (Скачать)

Управление  индексированием  в поисковой системе  Апорт

     При просмотре содержимого сервера для индексирования Апорт проверяет файл robots.txt и поддерживает мета-теги Robots. При просмотре содержимого сервера для индексирования Апорт проверяет файл robots.txt. Таким образом, можно ограничить "деятельность" Апорта на сервере. Поисковый робот Апорт имеет имя Aport. Именно это имя может быть использовано для ограничения индексирования через robots.txt.

     Также поисковая система Апорт поддерживаются мета-теги Robots, позволяющие, установить правила поведения робота на индивидуальной странице сайта и в случае, если нет возможности изменять файл robots.txt на сервере.

Добавление  страниц в поисковой  системе Апорт

     Регистрация сайта в Апорте производится со страницы Добавить URL. Добавлять следует только корень сайта. Регистрация сайта в Апорте производится со страницы http://catalog.aport.ru/rus/reg/add.ple. Эта страница доступна по ссылке Добавить URL почти с любой страницы Апорта. Добавлять следует только корень сайта, остальные страницы будут найдены Апортом по ссылкам.

     Апорт является поисковой системой по российскому Интернету, поэтому добавлять в нее можно русскоязычные сайты, а также сайты, имеющие непосредственное отношение к российскому Интернету. В случае отказа в автоматическом добавлении сайта (например, если поисковый робот не найдет на его корневой странице русскоязычного текста) можно обратиться с просьбой о добавлении сайта по e-mail: addurl@rol.ru

Индексация  ресурсов поисковой  системой Апорт

 

     Апорт - полнотекстовая поисковая система. Это означает, что она индексирует  все слова, которые бы увидел на экране человек, просматривая конкретную страницу сервера. Апорт периодически проверяет имеющиеся в его базе сайты и приводит свою базу в соответствие с произошедшими там изменениями. Период проверки в значительной степени зависит от конкретного сайта (учитывается его популярность, динамичность обновления по данным собранным апортом при предыдущих заходах на сайт и ряд других факторов).

     С момента добавления сайта в поисковую  систему Апорт до момента его  появления в поисковой базе проходит от двух-трех дней до двух недель. В отдельных случаях, (например, в случае нестабильной связи с добавленным сайтом), это время может оказаться несколько больше.

     Апорт индексирует все статические  документы (в Url которых не встречается  символ "?"), найденные его поисковым роботом по ссылкам на сайте. Это правило может не соблюдаться для больших по объему сайтов, а также для сайтов, замеченных в применения поискового спама.

     Документы, содержащие в Url символ "?", индексируются  поисковой системой Апорт выборочно. При этом используется квотирование количества таких документов для каждого сайта. Размер квоты вычисляется автоматически в зависимости от ряда условий, в частности от индекса цитируемости сайта, и может, в частности, быть для некоторых сайтов нулевым.

     Необходимо  учитывать, что полная индексация сайта  может происходить постепенно, а  также то, что содержание базы является прерогативой поисковой системы и каких-либо гарантий по индексации (а также сохранению в индексе уже проиндексированных документов) Апорт не дает.

     Для документов HTML кроме основного текста документа индексируются также: заголовок документа (TITLE), ключевые слова (META KEYWORDS), описания страниц (META DESCRIPTION) и подписи к картинкам (ALT). Кроме  того, Апорт индексирует как принадлежащие документу, тексты гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами, а также составленные (или проверенные) редакторами описания сайтов из каталога Апорт.  

     Апорт-каталог  один из крупнейших в Рунете каталогов интернет-ресурсов. Более 140 000 составленных вручную описаний сайтов, распределенных по 7000 категориям тематического и 3000 географического рубрикаторов. Начальная страница каталога совпадает с главной страницей проекта www.aport.ru.

Преимущества поисковой системы

Англо-русский  и русско-английский перевод в  он-лайн режиме запросов и результатов  поиска;

  • Автоматическая проверка орфографии запросов;
  • Более информативная выдача (в результатах поиска «Апорт» выдает более одного предложения по каждому сайту);
  • Использование при поиске всех возможных форм слова;
  • Официальная сертификация Microsoft в качестве локальной поисковой системы для Internet Explorer (русская версия);
  • Полное индексирование контента, заголовков страниц, «META KEYWORDS» (до 10 ключевых слов) и подписей к рисункам;
  • Ручная проверка описаний страниц.

Виды поиска

Простой поиск

     В данном случае, используются поисковые  запросы из одного или нескольких слов. При этом поисковая система  выдает документы, где представлены почти все слова из запроса (частицы, междометия и др. элементы, не несущие логической нагрузки, игнорируются).

Специальный поиск

     При подаче запросов могут использоваться логические операторы: И (AND, &, +, И), ИЛИ (OR, |, ИЛИ), НЕ (NOT, -, НЕ), и многие другие.

     Система «Апорт» поддерживает поиск как  по целой фразе, так и по отдельной  части слова. При этом фраза должна быть заключена в кавычки, а недостающая  часть слова обозначена «звездочкой» - *.

     Также, «Апорт» распознает и некоторые  специальные операторы, благодаря  чему можно искать документы с  определенным количеством слов между  ключевиками, с заданной датой и  адресом (URL) и ограничивать область  поиска на странице (заголовком, тегами «META KEYWORDS», «ALT» и т.д.).

Популярные сервисы «Апорт»

     В настоящее время возможности  поисковой системы «Апорт» не так обширны, но все-таки значительны. На официальном сайте поисковика можно найти каталог, охватывающий добрую часть русскоязычных Интернет-ресурсов, с удобным рубрикатором и системой выдачи. Также, на «Апорт» представлена актуальная информация различного рода: это и программа телевидения, и новости, и прогноз погоды, и котировки валют.

     Особый  блок сервисов поисковика составляют почта, справочная информация (в разделе «Словари») и поиск объекта по адресу (для Москвы, Санкт-Петербурга, а также для федеральных округов РФ: Дальневосточного, Приволжского, Северо-Западного, Сибирского, Уральского, Центрального и Южного).

     С помощью «Доски объявлений» от «Апорт» можно приобрести, продать, подарить или принять в дар все, что угодно: от котят до земельных участков. Данный сервис предлагает еще и поиск работы, однако найти здесь настоящие вакансии среди сомнительных объявлений довольно сложно.

Апорт-лайт

     Страница поиска без рекламы. Эта страница позволяет максимально быстро и эффективно использовать поисковую систему. На странице присутствуют только необходимые для поиска элементы - строка запроса и кнопка. Также, для удобства пользователей существует “подсказка” при наборе запроса в поисковой строке. В качестве “подсказки” используется база запросов, которые были набраны пользователями при обращении к Апорту.

     Мапорт  Мелодии, логотипы и java-игры для всех популярных моделей мобильных телефонов. Удобная систематизация и навигация позволяет пользователям найти интересующий их контент, а система подписки дает возможность постоянно получать информацию о новинках сайта.

     ТВ-программа Программа телепередач на текущую и следующую недели. Также можно ознакомиться с анонсами наиболее интересных передач и фильмов.

     Погода  на Апорте

     Прогноз погоды для различных городов  Мира. Информационной блок с прогнозом  погоды отображается на странице www.aport.ru. По умолчанию в этом блоке показывается погода для Москвы, но можно настроить  отображение погоды для любого интересующего города. Для этого нужно перейти на страницу погоды для выбранного города и щелкнуть по кнопке “Публиковать на www.aport.ru”. Это и просто, и удобно!

     WAP.Aport.ru Версия Апорта для мобильных телефонов. Сегодня это быстрый поиск по интернет-сайтам и/или каталогам музыкальных файлов (midi, mp3), это прогноз погоды на неделю вперед, это курсы основных валют и доступ к почте.

Апорт – справка

     Апорт-справка – это совместный проект с компанией <Евро-Адрес>, содержит базу данных справочной информации о более чем 300 000 организаций РФ. С помощью системы поиска, удобной навигации по каталогу товаров и услуг, региональному рубрикатору пользователь получает список организаций с указанием названия, адреса, телефонов, URL, электронной почты, дополнительных сведений о виде и предмете деятельности. Координаты организаций отображаются на географической карте.

Заключение

     После долгого молчания, когда интернет-общественность уже окрестила «Апорт» полуживым  проектом, поисковая система вдруг неожиданно очнулась от спячки и объявил об обновлении серверного парка.

     В целом, в поисковой системе «Апорт»  задействовано более 50 высокопроизводительных серверов. В эту цифру входят:

  • front-end серверы, принимающие и обрабатывающие запросы от пользователей;
  • поисковые серверы, на которых хранится база «Апорт», по которой ведется поиск документов;
  • индексирующие серверы, которые производят обновление базы документов;
  • серверы поиска и индексации по дополнительным базам «Апорта»:
      • поиска по знакомствам от «Омена», портальным новостям Рол.Ру, товарам, энциклопедии «Кругосвет», рефератам от Реферат.Ru, поиска по импортируемым новостям с других сайтов (новости Апорт.Ру), поиска по каталогу «Апорт», по вакансиям. — всего более двух десятков дополнительных баз;
  • комплекс из нескольких серверов, обеспечивающих ряд внутренних сервисов «Апорта»: работу с подсчетом индекса цитирования сайтов, обработку добавляемых сайтов в базу «Апорта», систему фильтрации сайтов в базе и удаление поискового спама из базы, работу со статистикой поиска, обновление базы географического таргетинга, etc

     На  данный момент в поисковой системе  «Апорт» проиндексировано более  миллиона сайтов, суммарный объем  проиндексированных документов превышает 2 Тб. Дальнейший рост размера базы и  увеличение количества кластеров в поисковой машине будет соответствовать увеличению содержимого Рунета.

     В настоящее время максимальное время  обработки запроса поисковой  системой «Апорт» не превышает 100 мс, а среднее время обработки  равно 78 мс. В сутки в среднем  на поисковую систему приходит около 750 тысяч запросов, то есть, около 9 запросов в секунду. При этом стоит отметить, что поисковая система обладает возможностью изменять внутренние параметры поиска в зависимости от текущей нагрузки, что позволяет избегать ситуации с перегруженностью поисковых серверов, и в тоже время, в случае наличия свободных аппаратных ресурсов, выдавать расширенные результаты поиска. В настоящее время имеется достаточный запас аппаратных ресурсов, что позволяет без увеличения времени поиска производить расширение как объема базы, так и увеличение функциональных возможностей поиска.

     Сейчас  главным разработчиком системы  является Алексей Боков. До перехода в РОЛ он занимался разработками в области компиляторов языков программирования в одной из российских процессинговых компаний.

     На  рынке существует мнение, что время  прежнего «Апорта» — как ни крути  — прошло, и оно уже никогда  не вернется. За несколько лет «Апорт»  растерял былые позиции, и вернуться  на прежний уровень будет очень  и очень сложно. РОЛ использовал и использует свои основные ресурсы для развития главного бизнеса — доступа в Интернет. Задача вступить в конкурентную борьбу с ведущими поисковыми машинами Рунета у нас никогда не стояла, это скорее вопрос к «Гуглу». Апорт не потерял свои позиции, он просто не рос так, как росли «Яндекс» и «Рамблер». Тем не менее, у нас достаточно крепкое ядро аудитории. Мы благодарны пользователям за то, что они понимают качество поиска «Апорта» без дополнительного маркетингового бюджета со стороны РОЛ.

 

      Литература

    1. Г.И. Куприянова Информационные ресурсы Internet / –М., 2002
    2. http://www.computerservices.ru/poiskovie-sistemi/aport
    3. http://www.vismech.ru/searchengin/poiskovaya-sistema-aport-ochnulas-ot/
    4. Андрей Аликберов "Несколько слов о том, как работают роботы поисковых машин". http://www.citforum.ru/internet/search/art_1.shtml

Информация о работе Поисковая система Апорт