Изучение средств подготовки поискового предписания и стратегий поиска документальной информации в реферативной БД

Автор: Пользователь скрыл имя, 05 Апреля 2013 в 03:10, лабораторная работа

Краткое описание

В данной лабораторной работе проводилось освоение средств подготовки поискового предписания и оценка стратегий поиска информации в базе данных реферативно-библиографической информации. Использовалось 3 технологии:
“Вербальная” технология
Технология накопления результата
Технология реформулировки запроса по обратной связи

Файлы: 1 файл

Лб1.docx

— 249.93 Кб (Скачать)

Национальный Исследовательский  Ядерный Университет

«МИФИ»


Факультет управления и экономики  высоких технологий

Институт инновационного менеджмента

Кафедра системного анализа

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отчет

По лабораторной работе №1:

 

«Изучение средств  подготовки поискового предписания  и

стратегий поиска документальной информации в реферативной БД»

 

 

 

 

 

Преподаватель: Максимов Н.В.

Студент: Галкина Екатерина

Группа: У7-06

Оценка___________________________

Подпись преподавателя______________________

 

 

 

Москва, 2009

 

 

В данной лабораторной работе проводилось освоение средств подготовки поискового предписания и оценка стратегий поиска информации в базе данных реферативно-библиографической  информации. Использовалось 3 технологии:

  • “Вербальная” технология
  • Технология накопления результата
  • Технология реформулировки запроса по обратной связи

Была произведена  оценка качества поиска с помощью  показателей эффективности работы АИПС «полнота-точность».

Выбранная тема – «Защита данных». Вопрос – системы хранения и защиты данных. В результате поиска были найдены документы, в которых рассмотрен данный вопрос.

Были выделены основные понятия, определяющие предметную область темы:

 

 

 

 

 

Наилучший результат дал эвристический поиск, т.к. просмотривается минимальное количество докуметнов, из которых количество релевантных максимально, т.к. ищутся документы, подобные уже заданным релевантным, что значительно уменьшает выдачу документов, не относящихся к заданной предметной области. Так же хороший результат дал поиск по ключевым словам, что может быть связано со спецефичностью выбранных терминов. Технология поиска по накоплению результатов дала результаты хуже, чем при эвристическом поиске, скорее всего из-за пересечения терминов между смежными темами.

 Исходя из этого  с помощью комбинации методов  поиска по полю «Ключевые слова»  и эвристического поиска был  проведен эффективный поиск: за 4 итерации было получено максимальное  количество релевантных документов  при минимальном количестве просмотренных  документов.

 

Цель  работы: Освоение средств подготовки поискового предписания и оценка стратегий поиска информации в базе данных реферативно-библиографической информации.

 

Метод выполнения. В работе используются три следующих поисковых технологии:

1). “Вербальная” технология - поиск по поисковому предписанию  (ПП) в режиме “запрос-ответ", в том числе:

  • поиск по структурированному ПП с использованием только нормализованной лексики поля ключевых слов и операторов алгебры логики;
  • поиск по ПП, построенному с использованием свободной лексики поля ключевых слов и операторов полного ИПЯ;
  • поиск по комбинированному ПП с использованием лексики нескольких поисковых полей, в том числе с использованием общего поискового словаря;
  • поиск по ПП с использованием критерия частичного вхождения.

 

2). Технология накопления  результата.

            3). Технология реформулирования  запроса по обратной связи.

 

Оценка качества поиска проводится с помощью показателей эффективности  работы АИПС «полнота-точность».

Для этого каждый полученный документ должен быть оценен на соответствие теме (информационной потребности) по следующей шкале:

- "релевантен", если  соответствует теме и удовлетворяет  информационной потребности;

- "неопределенная релевантность", если соответствует теме, но не  удовлетворяет информационной потребности;

- "нерелевантен", если  не соответствует теме.

 

 

Порядок выполнения работы

Работа выполняется в  среде АИПС WinIRBIS на материале БД «Информатика» и включает в себя три этапа:

1. Структурирование запроса  и формирование исходного поискового  предписания;

2. Изучение технологии  формирования ПП и выполнения  поиска по запросу;

3. Поиск в режиме динамического  реформулирования запроса.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Этап 1. Структурирование запроса и формирование исходного ПП

Тема: «Системы  хранения и защиты данных»

Предметная область определяется пересечением двух областей:

  1. Системы хранения данных:

Ключевые слова: БАЗЫ ДАННЫХ, СУБД, ИНФОРМАЦИОННЫЕ СИСТЕМЫ, СТРУКТУРА

  1. Защита данных:

Ключевые слова: ЗАЩИТА ИНФОРМАЦИИ, ПРОЕКТИРОВАНИЕ, ЗАЩИТА

 

 

Аспекты темы:

  • Классификация данных
  • Архитектура субд
  • Контроль доступа
  • Механизмы защиты
  • Обмен данными

 

Исходное  поисковое предписание:

  • KW: ((' Классификация данных') or ('архитектура субд') or ('контроль доступа') or ('механизмы защиты') or ('обмен данными'))

Поиск по полю "Ключевые слова" дал  51 документа, из них 10 релевантных (19.5%).

 

 

 

Частота термина

Термин

В Выдаче

В Базе

Классификация данных

3

3

Архитектура субд

1

1

Контроль доступа

16

16

Механизмы защиты

6

6

Обмен данными

25

25




 

Таблица №1

a

b

c

p

r

10

41

157

0.1961

0.0599




 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Этап 2. Изучение “вербальной” технологии поиска по запросу

 Модифицированное поисковое предписание:

  • KW: ((' Классификация данных') or ('архитектура субд') or ('контроль доступа') or ('механизмы защиты'))

Поиск по полю "Ключевые слова" дал 26 документов, из них 11 релевантных.

 

 

 

 

 

Частота термина

Термин

В Выдаче

В Базе

Классификация данных

3

3

Архитектура субд

1

1

Контроль доступа

16

16

Механизмы защиты

6

6





Таблица №2

 

a

b

c

p

r

13

13

154

0.5000

0.0778




 

 

 

 

 

 

 

 

 

 

Модифицированное  поисковое предписание по полю Реферат:

AB: ((' Классификация’ NEAR[0] ‘данных') or ('архитектура’ NEAR[0] ‘субд') or ('контроль’ NEAR[0] ‘доступа') or ('механизмы’ NEAR[0] ‘защиты'))

a

b

c

p

r

21

23

146

0.4773

0.1257





Поиск по полю "Реферат" дал 44 документов, из них 20 релевантных.

Таблица №3

 

Результат объединения  результатов поиска по полю «Реферат»  и «Ключевые слова»:

 

a

b

c

p

r

42

47

125

0.4719

0.2515





89 документов, из них 42 релевантных.

Таблица №4

 

 

 

 

Результат объединения  результатов поиска по полю «Реферат», «Ключевые слова» и «Заголовок»:

 

a

b

c

p

r

42

47

125

0.4719

0.2515





89 документа, из них 42 релевантных.

Таблица №5

 

 

 

Поиск по критерию автомаскирования:

 

KW: (('Классификац’* and ‘данн'*) or ('архитектур’* and ‘субд') or ('контрол’* and ‘доступ'*) or ('механизм’* and ‘защит'*))

a

b

c

p

r

21

10

146

0.6774

0.1257





KW: Поиск дал 31 документов, из них 21 релевантных.

Таблица №6

 

 

AB: (('Классификац’* NEAR[0] ‘данн'*) or ('архитектур’* NEAR[0] ‘субд') or ('контрол’* NEAR[0] ‘доступ'*) or ('механизм’* NEAR[0] ‘защит'*))

 

a

b

c

p

r

20

121

147

0.1418

0.1198





AB:  Поиск дал 141 документов, из них 20 релевантных.

Таблица №7

 

 

Поиск по критерию частичным  автомаскированием:

KW: (('Классификация’ and ‘данных') or ('архитектур’* and ‘субд') or ('контрол’* and ‘доступ'*) or ('механизм’* and ‘защит'*))

 

a

b

c

p

r

24

6

90

0,8

0,27





KW: Поиск дал 30 документа, из них 24 релевантных.

Таблица №8

 

 

AB: (('Классификация’ NEAR[0] ‘данных') or ('архитектур’* NEAR[0] ‘субд') or ('контрол’* NEAR[0] ‘доступ'*) or ('механизм’* NEAR[0] ‘защит'*))

 

a

b

c

p

r

19

96

148

0.1652

0.1138





AB:  Поиск дал 115 документов, из них 19 релевантных.

Таблица №9

 

 

              Этап 3. Изучение технологии реформулирования запроса “по обратной связи”

Итеративный эвристический поиск

     Был выполнен  эвристический поиск для релевантных  документов, полученных при поиске  по ключевым словам поискового предписания: 

 

  • KW: ((' Классификация данных') or ('архитектура субд') or ('контроль доступа') or ('механизмы защиты'))

Было получено 25 документов, из них 7 релевантных

 

 

a

b

c

p

r

7

18

160

0.2800

0.0419





Таблица №10

 

 

Был проведен эвристический  поиск полученного результата:

Получено 25 документов, из них  8 релевантных.

                                                                                                            

a

b

c

p

r

8

17

159

0.3200

0.0479

Информация о работе Изучение средств подготовки поискового предписания и стратегий поиска документальной информации в реферативной БД