Шпаргалка по "Информатике"

Автор: Пользователь скрыл имя, 13 Мая 2012 в 22:07, шпаргалка

Краткое описание

Работа содержит ответы на вопросы для экзамена по "Информатике".

Файлы: 1 файл

Документ Microsoft Office Word (2).docx

— 61.08 Кб (Скачать)

Между логическими  и поисковыми языками нет принципиальной разницы, так как многие информационные языки могут использоваться как  в одной, так и в другой системе. Любые информационные языки должны обеспечивать однозначную запись информации и её последующее распознавание с определённой полнотой и точностью, а информационно-логический язык, помимо этого — формализацию логического вывода.

АИПС предназначены для инф. обслуживания пользователей информации в заданной тематической области. 2 основные задачи АИПС: * хранение информации * поиск и выдача информации Из сведений о ТО. поступающих на хранение в систему формируется информационный массив (ИМ). От потребителя поступают запросы, и система ищет сведения в ИМ, Соответствующие данному запросу. Всякая поисковая операция в системе сводится к сравнению поступившего запроса с имеющимися в системе сведениями. в современных ИПС все это происходит автоматически. Для этого и запрос и сведения должны быть представлены на таком языке, который обладает смысловой однозначностью - ИПЯ. Индексирование - перевод содержания текста, хранящегося в ИМ на ИПЯ. в результате индексирования образуется поисковый образ, у документа - ПОД, у запроса - ПОЗ. Критерий смыслового соответствия - мера соответствия между содержанием запроса и документа, достаточная для признания данного документа релевантным данному запросу. Вводится совокупность признаков, на основании которых устанавливается степень необходимого и достаточного соответствия между поисковым предписанием и поисковым образом документа, выраженными на одном и том же ИПЯ. Результатом поисковой операции является выборка релевантных ПОДов. Абстрактная ИПС - некий логико-семантический аппарат, состоящий из ИПС, правил индексирования и критерия выдачи. В зависимости от характера сведений и запроса различаются документальная и фактографическая ИПС. Фактографическая ИПС не хранит документы, а только факты. Документальная хранит документы. Но существует прием, позволяющий в процессе поиска определенного документа извлекать факт: В документальной системе хранится информация о содержании документа + документографическая информация (автор, год ...) выделение нужной пользователю информации осложняется двумя обстоятельствами: * несоответствие между формулировкой запроса и реальной информацией нужной потребителю * перевод запроса в ПОЗ Мера соответствия документа информационной потребности называется пертенетностью. Соответствие документа запросу называется релевантностью: * смысловая (соответствие запроса поисковому предписанию) - просто релевантность, зависит от ИПЯ (его семантической силы, глубины индексирования, совершенства логико-сем. аппарата) * формальная (соответствие документа поисковому предписанию) ИПЯ - специализированный ИЯ, предназначенный для эксплицитной записи содержания документов и запросов в форме, удобной для автоматического поиска. Классификация ИПЯ: предкоординированные ИПЯ присутствует заранее заданная классификационная схема посткоординируемые ИПЯ отсутствует заранее заданная классификационная схема Типы классификаций иерархическая задает дерево знаний, например всей литературы по лингвистике алфавитно-предметная например, телефонный справочник фасетная опирается на разные аспекты описания, задается так называемая фасетная формула (Ж1 Ц2 Ф1), представляющая собой шаблон, рассматривается класс, аспект предмета Фасетная классификация: фильмы: жанр цвет формат Ж1 Ж2 Ц1 цветной Ц2 черно-белый Ф1 широкоформатный фасетная формула: Ж1 Ц2 Ф1 Общие недостатки предкоординированных ИПЯ: * не позволяют вести поиск по заранее непредусмотренному сочетанию признаков * все классификации имеют недостаточную глубину * процесс индексирования принципиально не автоматизирован, т. е ручное индексирование Посткоординируемые ИПЯ: семантические коды в ЛЕ в явном виде заданы парадигматические отношения дескрипторы оперируют монолитными СЕ, в основу положен принцип координированного индексирования, который выражается в том. что основная тема документа выражается в виде набора слов или СС, т. о документ помещается в n-мерное пространство Семантические коды Перри и Кента (США) м.б простыми и составными, простая ЛЕ - СЕМ. МНОЖИТЕЛЬ; RX КОДЫ РУЧНОЕ ИНДЕКСИРОВАНИЕ грамматики мешочного типа (теоретико-множественные грамматики) задаются отношением совместного вхождения в класс, ПОД составляется вручную, ПОД -перечень ключевых слов. позиционно-скобочные грамматики сохранение всего исходного текста документа с явным указанием порядка следования, деления на абзацы, предложения: сетевые грамматики в явном виде задается смысл связи между элементами текста (Скрэгг) ИПЯ с ПСГ: * индексирование без лексического контроля, до индексирования могут не иметь словаря, словарь формируется в результате индексирования. * индексирование с лексическим контролем - все словоформы приводятся к стандартному виду 
 
 
 
 

    3.9.Понятие хранилища данных (ХД), визуализация данных, полученных из хранилища. 

Хранилище данных (англ. Data Warehouse) — предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Данные, поступающие в хранилище данных, как правило, доступны только для чтения. Данные из OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчётов и OLAP-анализ не использовал ресурсы транзакционной системы и не нарушал её стабильность. Как правило, данные загружаются в хранилище с определённой периодичностью, поэтому актуальность данных может несколько отставать от OLTP-системы. 
 
 
 
 
 


Информация о работе Шпаргалка по "Информатике"