Автор: Пользователь скрыл имя, 13 Мая 2012 в 22:07, шпаргалка
Работа содержит ответы на вопросы для экзамена по "Информатике".
Между логическими и поисковыми языками нет принципиальной разницы, так как многие информационные языки могут использоваться как в одной, так и в другой системе. Любые информационные языки должны обеспечивать однозначную запись информации и её последующее распознавание с определённой полнотой и точностью, а информационно-логический язык, помимо этого — формализацию логического вывода.
АИПС предназначены
для инф. обслуживания пользователей информации
в заданной тематической области. 2 основные
задачи АИПС: * хранение информации * поиск
и выдача информации Из сведений о ТО.
поступающих на хранение в систему формируется
информационный массив (ИМ). От потребителя
поступают запросы, и система ищет сведения
в ИМ, Соответствующие данному запросу.
Всякая поисковая операция в системе сводится
к сравнению поступившего запроса с имеющимися
в системе сведениями. в современных ИПС
все это происходит автоматически. Для
этого и запрос и сведения должны быть
представлены на таком языке, который
обладает смысловой однозначностью - ИПЯ.
Индексирование - перевод содержания текста,
хранящегося в ИМ на ИПЯ. в результате
индексирования образуется поисковый
образ, у документа - ПОД, у запроса - ПОЗ.
Критерий смыслового соответствия - мера
соответствия между содержанием запроса
и документа, достаточная для признания
данного документа релевантным данному
запросу. Вводится совокупность признаков,
на основании которых устанавливается
степень необходимого и достаточного
соответствия между поисковым предписанием
и поисковым образом документа, выраженными
на одном и том же ИПЯ. Результатом поисковой
операции является выборка релевантных
ПОДов. Абстрактная ИПС - некий логико-семантический
аппарат, состоящий из ИПС, правил индексирования
и критерия выдачи. В зависимости от характера
сведений и запроса различаются документальная
и фактографическая ИПС. Фактографическая
ИПС не хранит документы, а только факты.
Документальная хранит документы. Но существует
прием, позволяющий в процессе поиска
определенного документа извлекать факт:
В документальной системе хранится информация
о содержании документа + документографическая
информация (автор, год ...) выделение нужной
пользователю информации осложняется
двумя обстоятельствами: * несоответствие
между формулировкой запроса и реальной
информацией нужной потребителю * перевод
запроса в ПОЗ Мера соответствия документа
информационной потребности называется
пертенетностью. Соответствие документа
запросу называется релевантностью: *
смысловая (соответствие запроса поисковому
предписанию) - просто релевантность, зависит
от ИПЯ (его семантической силы, глубины
индексирования, совершенства логико-сем.
аппарата) * формальная (соответствие документа
поисковому предписанию) ИПЯ - специализированный
ИЯ, предназначенный для эксплицитной
записи содержания документов и запросов
в форме, удобной для автоматического
поиска. Классификация ИПЯ: предкоординированные
ИПЯ присутствует заранее заданная классификационная
схема посткоординируемые ИПЯ отсутствует
заранее заданная классификационная схема
Типы классификаций иерархическая задает
дерево знаний, например всей литературы
по лингвистике алфавитно-предметная
например, телефонный справочник фасетная
опирается на разные аспекты описания,
задается так называемая фасетная формула
(Ж1 Ц2 Ф1), представляющая собой шаблон,
рассматривается класс, аспект предмета
Фасетная классификация: фильмы: жанр
цвет формат Ж1 Ж2 Ц1 цветной Ц2 черно-белый
Ф1 широкоформатный фасетная формула:
Ж1 Ц2 Ф1 Общие недостатки предкоординированных
ИПЯ: * не позволяют вести поиск по заранее
непредусмотренному сочетанию признаков
* все классификации имеют недостаточную
глубину * процесс индексирования принципиально
не автоматизирован, т. е ручное индексирование
Посткоординируемые ИПЯ: семантические
коды в ЛЕ в явном виде заданы парадигматические
отношения дескрипторы оперируют монолитными
СЕ, в основу положен принцип координированного
индексирования, который выражается в
том. что основная тема документа выражается
в виде набора слов или СС, т. о документ
помещается в n-мерное пространство Семантические
коды Перри и Кента (США) м.б простыми и
составными, простая ЛЕ - СЕМ. МНОЖИТЕЛЬ;
RX КОДЫ РУЧНОЕ ИНДЕКСИРОВАНИЕ грамматики
мешочного типа (теоретико-множественные
грамматики) задаются отношением совместного
вхождения в класс, ПОД составляется вручную,
ПОД -перечень ключевых слов. позиционно-скобочные
грамматики сохранение всего исходного
текста документа с явным указанием порядка
следования, деления на абзацы, предложения:
сетевые грамматики в явном виде задается
смысл связи между элементами текста (Скрэгг)
ИПЯ с ПСГ: * индексирование без лексического
контроля, до индексирования могут не
иметь словаря, словарь формируется в
результате индексирования. * индексирование
с лексическим контролем - все словоформы
приводятся к стандартному виду
3.9.Понятие
хранилища данных (ХД), визуализация данных,
полученных из хранилища.
Хранилище данных (англ.
Data Warehouse) — предметно-ориентированная
информационная база данных, специально
разработанная и предназначенная для
подготовки отчётов и бизнес-анализа с
целью поддержки принятия решений в организации.
Строится на базе систем управления базами
данных и систем поддержки принятия решений.
Данные, поступающие в хранилище данных,
как правило, доступны только для чтения.
Данные из OLTP-системы копируются в хранилище
данных таким образом, чтобы построение
отчётов и OLAP-анализ не использовал ресурсы
транзакционной системы и не нарушал её
стабильность. Как правило, данные загружаются
в хранилище с определённой периодичностью,
поэтому актуальность данных может несколько
отставать от OLTP-системы.