Автор: Пользователь скрыл имя, 02 Марта 2013 в 11:12, реферат
С развитием технологий записи и хранения данных на людей обрушились колоссальные потоки информационной руды в самых различных областях- коммерции, производстве, науке, медицине и т.д. Стало понятно, что без продуктивной переработки потоки сырых данных образуют никому не нужную свалку.
Методов традиционной статистики оказалась явно недостаточно для качественного анализа больших объемов данных.
Под данными принято понимать отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства. Для сбора, анализа и хранения данных используются технологии, лежащие в основе современных баз данных (СУБД).
Знания – это закономерности предметной области (принципы, связи, законы), полученные в результате практического опыта и теоретических исследований, позволяющие решать задачи данной предметной области.
Знания возможны только как результат переработки (анализа, обобщения) некоторых исходных фактов и других знаний. Сама глубина этих новых знаний и форма их представления существенно зависят от способов их получения.
Человечество в процессе своего развития выработало и вырабатывает некоторые стандартные процедуры работы со знаниями, ускоряющие и облегчающие анализ данных и знаний и получение новых знаний. Поскольку способ представления знаний жестко связан со способом их представления, то эти стандартные процедуры можно назвать еще методами формализации знаний. Исторически первым инструментом формализации знаний можно считать логику Аристотеля, вторым – математику. С появлением компьютеров возникли компьютерные подходы к формализации знаний.
Первый из таких подходов к формализации знаний стал алгоритмический, или процедурный подход. Такой подход использует для получения новых результатов традиционные языки программирования – от машинных кодов, до Паскаля и Си. Этот подход хорошо справляется с теми задачами, которые можно представить в полностью формализованном виде, однако непригоден для решения слабоформализованных или неформализованных задач. Но большинство практических задач относятся именно к этому классу. Для формализации представления таких слабоформализованных задач были созданы с использованием достижений компьютерных технологий и психологии новые более гибкие способы формализации человеческих знаний. Все эти способы в формализованном виде представляют характерные черты представления информации (знаний), человеком, фактически моделируют те или иные аспекты человеческого мышления, в связи с чем получили название моделей представления знаний. Сейчас известны десятки таких моделей, а практика их применения привела к появлению новой науки – инженерии знаний. Методы инженерии знаний широко используются в так называемой когнитивной психологии с целью лучшего понимания и представления, как мыслит человек. Однако основное назначение инженерии знаний в настоящее время – это формализованное представления человеческих знаний с помощью компьютерных технологий. Собранные вместе такие формализованные знания, описывающие какую-либо предметную область, либо предназначенные для решения определенного круга задач, представляют собой базы знаний. Такие базы знаний являются центральной частью современных экспертных систем и систем поддержки принятия решений.
Наиболее известны и широко используются четыре модели представления знаний:
В этом случае мы представляем себе предметную область как состоящую из некоторых сущностей и их отношений. При этом в качестве некоего исходного каркаса предметной области выступают сущности.
При этом сущности предметной
области находятся в
Отношения между сущностями выражаются с помощью суждений. Суждение-это мысленно возможная ситуация, которая может иметь место для предъявляемых сущностей или не иметь места. В языке (формальном или естественном) суждениям отвечают предложения. Суждения и предложения также можно рассматривать как сущности и включать в предметную область.
Для представления математического знания в математической логике давно пользуются логическими формализмами - главным образом исчислением предикатов, которое имеет ясную формальную семантику и операционную поддержку в том смысле, что для него разработаны механизмы вывода. Поэтому исчисление предикатов было первым логическим языком, который применили для формального описания предметных областей, связанных с решением прикладных задач.
Описания предметных областей, выполненные в логических языках, называются (формальными) логическими моделями.
Достоинством логической модели представления знаний является единственность теоретического обоснования и возможность реализации формально точных определений и выводов. Описание предметной области с помощью логических моделей широко использовалось на первых этапах развития компьютерных технологий. Однако в настоящее время круг их использования неширок (в основном, логические задачи и игры). Это связано с тем, что при решении слабоформализованных задач попытка представить неформализованные знания человека (эксперта) в виде четких формализованных правил приводит к серьезным искажениям исходной информации, в результате чего и ответ может быть существенно неадекватным ситуации.
3. Продукционные модели
В продукционной модели, или иначе, модели правил, знания представляют собой совокупность правил вида «Если-То».. Такие правила называются продукциями, с чем и связано название этого типа моделей.
Продукции, с одной стороны, близки к логическим моделям, что позволяет организовывать на них эффективные процедуры вывода, а с другой стороны, более наглядно отражают знания, чем классические логические модели. В них отсутствуют жесткие ограничения, характерные для логических исчислений, что дает возможность изменять интерпретацию элементов продукции.
В общем виде под продукцией понимается выражение следующего вида:
(i); Q; Р; А=>В; N.
Здесь i-имя продукции, с помощью которого данная продукция выделяется из всего множества продукций. В качестве имени может выступать некоторая лексема, отражающая суть данной продукции (например, "покупка книги" или "набор кода замка"), или порядковый номер продукции в их множестве, хранящемся в памяти системы.
Элемент Q характеризует сферу применения продукции. Такие сферы легко выделяются в когнитивных структурах человека. Наши знания как бы "разложены по полочкам". На одной "полочке" хранятся знания о том, как надо готовить пищу, на другой-как добраться до работы и т. п. Разделение знаний на отдельные сферы позволяет экономить время на поиск нужных знаний. Такое же разделение на сферы в базе знаний ИС целесообразно и при использовании для представления знаний продукционных моделей.
Основным элементом продукции является ее ядро: А=>В. Интерпретация ядра продукции может быть различной и зависит от того, что стоит слева и справа от знака секвенции =>. Обычное прочтение ядра продукции выглядит так: ЕСЛИ A, ТО B, более сложные конструкции ядра допускают в правой части альтернативный выбор, например, ЕСЛИ А, ТО B1, ИНАЧЕ B2. Секвенция может истолковываться в обычном логическом смысле как знак логического следования В из истинного А (если А не является истинным выражением, то о В ничего сказать нельзя). Возможны и другие интерпретации ядра продукции, например A описывает некоторое условие, необходимое для того, чтобы можно было совершить действие В.
Элемент Р есть условие применимости ядра продукции. Обычно Р представляет собой логическое выражение (как правило, предикат). Когда Р принимает значение "истина", ядро продукции активизируется. Если Р ложно, то ядро продукции не может быть использовано. Например, если в продукции "НАЛИЧИЕ ДЕНЕГ; ЕСЛИ ХОЧЕШЬ КУПИТЬ ВЕЩЬ X, ТО ЗАПЛАТИ В КАССУ ЕЕ СТОИМОСТЬ И ОТДАЙ ЧЕК ПРОДАВЦУ" условие применимости ядра продукции ложно, т. е. денег нет, то применить ядро продукции невозможно.
Элемент N описывает постусловия продукции. Они актуализируются только в том случае, если ядро продукции реализовалось. Постусловия продукции описывают действия и процедуры, которые необходимо выполнить после реализации В. Например, после покупки некоторой вещи в магазине необходимо в описи товаров, имеющихся в этом магазине, уменьшить количество вещей такого типа на единицу. Выполнение N может происходить не сразу после реализации ядра продукции.
Если в памяти системы хранится некоторый набор продукций, то они образуют систему продукций. В системе продукций должны быть заданы специальные процедуры управления продукциями, с помощью которых происходит актуализация продукций и выбор для выполнения той или иной продукции из числа актуализированных.
Основные достоинства продукционных моделей:
Недостатки:
Продукционные модели получили широкое распространение в современных базах знаний, особенно используемых в экспертных системах. Однако только этих моделей знаний, как правило, недостаточно для решения слабоформализованных задач и они дополняются более гибкими моделями знаний – фреймовыми и сетевыми.
4. Фреймовая модель представления знаний
Эта модель была предложена в 1975 г. одним из пионеров в области искусственного интеллекта Марвином Мински. Она учитывает тот факт, что человек в отличие от компьютера перерабатывает информацию не отдельными битами, а некоторыми целостными образами. В начале 20-го века немецкий психолог Келлер впервые высказал предположение о целостном процессе переработки информации у человека и предложил для этих целостных образов термин «гештальт», получивший широкое распространение в психологии. Однако в компьютерных технологиях идея гештальта распространения не получила в связи с отсутствием четких и ясных представлений о том, как в гештальте представлена информация и как ее можно записать в компьютерном виде. Идея Минского как раз заключается в формализации понятия гештальта и в представлении его в виде простой и однозначной структуры, позволяющей запись в компьютерном виде.
Под фреймом
в общем случае принято понимать
некоторую минимальную
Эти базовые свойства могут иметь какие-либо характеристики, включая численные значения, текстовые описания и т.п. Ячейки для задания характеристик базовых свойств фрейма называют слотами.
Рассмотрим пример фрейма. Так, понятие комнаты включает в себя жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью – эти понятия составляют перечень базовых свойств фрейма комнаты. Некоторые из этих базовых свойств в рамках рассматриваемой задачи не требуют описания (например, потолок), а некоторые должны быть описаны более детально (например, количество окон, площадь комнаты) – это описание производится в слотах. Перечень базовых свойств вместе со значениями соответствующих им свойств и составляет фрейм комнаты.
Различают фреймы-образцы, или прототипы, содержащие в себе перечень основных свойств фрейма (имена слотов) без задания конкретных значений слотов, и фреймы-экземпляры, содержащие конкретные значения слотов и предназначенные для отображения реальных ситуаций.
Структура фрейма может быть представлена как в текстовом, так и в табличном виде. При записи структуры в текстовом виде вначале записывается имя фрейма, а затем идет перечень свойств-слотов (фрейм-прототип).
Табличная форма (для фрейма-экземпляра) состоит из четырех колонок:
Имя фрейма | |||
Имя слота |
Значение слота |
Способ получения значения |
Присоединенная процедура |
В этом представлении первые три столбца описывают одиночный фрейм, а четвертый предназначен для описания некоторой системы взаимосвязанных фреймов. В этом случае значения ряда слотов данного фрейма равны или выводятся по определенной процедуре из некоторых выходных значений (слотов) другого фрейма.
В целом концепция
фреймов использует целый ряд
понятий объектно-
5.Семантические сети
Под семантической сетью в общем случае понимается ориентированный граф, вершины которого – понятия, а дуги – отношения между ними. Семантические сети возникли как способ моделирования человеческого мышления. Их главной особенностью является связывание воедино мыслительных единиц совершенно разной природы – эмоциональных, предпочтений, информационных, управляющих и т.д. Эта особенность отличает семантические сети от других типов модельных представлений, ограничивающихся минимальным количеством типов понятий в модели, к тому же находящихся в строго упорядоченных позициях к структуре модели.
Информация о работе Системы обработки экономической информации