Автор: Пользователь скрыл имя, 23 Октября 2011 в 23:02, контрольная работа
Технология экспертных систем является одним из направлений новой области исследований, называемой искусственным интеллектом (ИИ, AI – Artificial Intellegence). По известному определению Бара и Файгенбаума:
Искусственный интеллект (ИИ) – это область информатики, которая занимается разработкой интеллектуальных компьютерных систем, т.е. систем, обладающих возможностями, которые мы традиционно связываем с человеческим разумом, - понимание языка, обучение способность рассуждать, решать проблемы и т.д.
Введение 3
1. Сущность экспертной системы 4
1.1. Краткий исторический очерк 4
1.2. Определение экспертной системы 5
1.3. Свойства экспертной системы 6
1.4. Достоинства и недостатки экспертной системы по сравнению с человеком 8
1.5. Структура экспертной системы 10
2. Модели представления знаний 13
2.1. Логическая модель представления знаний 15
2.2. Продукционная модель представления знаний 16
2.3. Представление знаний фреймами 17
2.4. Представление знаний семантическими сетями 19
3. Области применения экспертных систем. 20
Среди многих достоинств логического подхода необходимо отметить: стирание противопоставления между выводом и вычислением, что позволяет эффективно использовать метазнания; наличие четкой семантики и правил ввода.
Серьезной проблемой в логическом подходе является отсутствие структуры, так как данные представляются в виде совокупности линейных формул. К недостаткам логических моделей можно отнести следующее. На основе аппарата исчисления предикатов можно доказать существование объекта, обладающего определенными свойствами, т.е. логика первого порядка обеспечивает удобные средства описания в любой ситуации, которая определяется объектами и высказываниями, истинными относительно них. Но с другой стороны, в исчислении предикатов нет понятия процесса, что приводит к невозможности присвоения имени объекту в ходе логических преобразований и дальнейшим ссылкам на него, а также отсутствует возможность описания взаимосвязей двух ситуаций.
Логический и семантический аппарат теории исчисления предикатов не позволяет непосредственно решать такие проблемы, как совместное использование информации в альтернативных гипотезах и в различные моменты времени, создание новых структур в результате получения новых данных, планирование и т.д.
Таким образом, существует определенный круг задач, которые нельзя решать, используя только методологию исчисления предикатов. Возникает необходимость представления знаний на комбинированной основе, т.е. если некоторая часть системы представления знаний или вся эта система реализуются с помощью исчисления предикатов, то все равно остается ряд проблем, связанных с выбором оптимальной аксиоматической структуры и организации, обеспечивающей эффективность интеллектуальных операций. Речь идет о средствах указания модальности (необходимости, возможности, условности), средствах создания референций и соотнесения их с соответствующими смысловыми описаниями, о механизмах нестрогих рассуждений, а также о методах решения проблем, связанных с рассуждениями о свойствах, о механизме процесса планирования.
Внутри совокупности способов представления, основанных на исчислении предикатов, существует ряд различных подходов – метод функций Сколема, метод явных кванторов существования, метод нормальных форм Сколема, метод конъюнктивных нормальных форм, метод постатейных представлений и другие. Эти методы позволяют создать на единой семантической базе совершенно различные представления, которые обеспечивают конкретные разновидности интеллектуальных операций.
Система продукций образуется множеством правил продукции. Эти правила формулируют определенные действия при выполнении некоторых заданных условий. Поскольку одновременно могут выполняться несколько условий, должна быть определена стратегия выбора.
В самом простом виде правила продукций близки по смыслу импликации «Если – то», поэтому для правил продукций можно принять обозначение или, раскрыв условие применимости, эта запись примет вид:
P1 ^ P2 ^ P3 . . . ^ Pn – B,
где Pi (i=1,2, ..., n) – условия применимости, образующие конъюнкцию;
В – заключение или действие,
которое имеет место при
Приведем пример правила продукций для экспертной системы, предназначенной для диагностики неисправности:
ЕСЛИ ВНУТРЕННЕЕ ТЕСТИРОВАНИЕ ПРОШЛО
И ИМЕЕТ МЕСТО МНОГОКРАТНАЯ ПЕРЕЗАГРУЗКА ОПЕРАЦИОННОЙ СИСТЕМЫ
ТО ЗАЛИПАНИЕ КЛАВИШ ИЛИ СБОЙ
ОЗУ.
Система
продукций выгодна для
Необходимо
различать продукционные
База знаний продукционной экспертной системы состоит из множества правил продукций (базы правил)
П={P1, P2, ..., Pm}
и конечного набора фактов (базы фактов)
A=(a1, a2, ..., an).
Если правило имеет вид Pi=ai1 ai2 ... ais -> am, то это значит, что новый факт am имеет место (т.е. правило Pi применимо) при условии истинности всех фактов ai1...ais, определяющих правило Pi.
В
случае, когда am – новый факт, имеет
место модификация
Возможен
случай, когда правило продукции
связано с выполнением какой-
Представление знаний в виде продукционных правил имеет недостатки и достоинства. Основным недостатком системы продукций является отсутствие внутренней структуры и зависимости шагов дедуктивного вывода от стратегии вывода, что делает ее трудно интерпретируемой.
Достоинства
продукционных систем: модульность
организации знаний; независимость
правил продукций; легкая модификация
знаний на основе возможного удаления
и добавления правил; возможность использования
различных управляющих стратегий за счет
отделения предметных знаний от управляющих.
Фреймы – это фрагменты знания, предназначенные для представления стандартных ситуаций. Термин «фрейм» (frame – рамка) был предложен М. Минским. Фреймы имеют вид структурированных наборов компонентов ситуации, называемых слотами. Слот может указывать на другой фрейм, устанавливая тем самым связь между двумя фреймами. Могут устанавливаться общие связи типа связи по обобщению, с каждым фреймом ассоциируется разнообразная информация (в том числе и процедуры), например, ожидаемые процедуры ситуации, способы получения информации о слотах, значения, принимаемые по умолчанию, правила вывода.
Формальная структура фрейма имеет следующий вид:
f[<N1,V1>,<N2,V2>.....<Nk,Vk>]
где f – имя фрейма;
пара <Ni,Vi> – i-й слот,
Ni – имя слота
и Vi – его значение.
Значение слота может быть представлено последовательностью
<K1><L1>; . . . ; <Kn><Tn>;<R1>; . . . ; <Rm>,
где Ki – имена атрибутов,
Li – значения этих атрибутов или множества их значений;
Rj – различные ссылки на другие слоты.
Каждый фрейм как структура хранит знания о предметной области (фрейм-прототип), а при заполнении слотов значениями превращается в конкретный фрейм события или явления. Фреймы можно разделить на две группы: фреймы-описания и ролевые фреймы.
Рассмотрим
примеры.
Фрейм-описание:
[<овощи>,<помидоры, Болгария 30
т>,<перец, Венгрия 10 т>,<баклажаны,
Молдова 20 т>]
Ролевой
фрейм:
[<доставить>,<что, прокат 10 т>,<откуда,
Гомель>,<куда, Минск>,<чем, авто>,<когда,
май>]
Во фрейме-описании в качестве имен слотов задан вид продукции, а значение слота характеризует массу и производителя конкретного вида продукции. В ролевом фрейме в качестве имен слотов выступают вопросительные слова, ответы на которые являются значениями слотов, для данного примера представлены уже описания конкретных фреймов, которые могут называться либо фреймами-примерами, либо фреймами-экземплярами. Если в приведенном примере убрать значения слотов, оставив только имена, то получим так называемый фрейм-прототип.
Достоинства
фрейма-представления во многом основываются
на включении в него предположений
и ожиданий. Это достигается за
счет присвоения по умолчанию слотам
фрейма стандартных ситуаций. В процессе
поиска решений эти значения могут
быть заменены более достоверными. Некоторые
переменные выделены таким образом, что
об их значениях система должна спросить
пользователя. Часть переменных определяется
посредством встроенных процедур, называемых
внутренними. По мере присвоения переменным
определенных значений осуществляется
вызов других процедур. Этот тип представления
комбинирует декларативные и процедурные
знания.
Фреймовые
модели обеспечивают требования структурированности
и связности. Это достигается
за счет свойств наследования и вложенности,
которыми обладают фреймы, т.е. в качестве
слотов может выступать система имен слотов
более низкого уровня, а также слоты могут
быть использованы как вызовы каких-либо
процедур для выполнения.
Для
многих предметных областей фреймовые
модели являются основным способом формализации
знаний.
Большая часть семантических моделей создана на базе семантических сетей. Этот термин обозначает целый класс подходов, для которых общим является использование графических схем с узлами, соединенными дугами. Узлы (вершины сети) представляют некоторые понятия (объекты, события, явления), а дуги – отношения между ними. Семантические модели являются объектно-ориентированными и обеспечивают в достаточной мере такой признак, как связность, реализуя четыре типа связей между объектами: классификацию, агрегирование, обобщение, ассоциацию.
Основная идея моделирования при помощи семантических моделей заключается в том, что модель представляет данные о реальных объектах и связях между ними прямым способом, что существенно облегчает доступ к знаниям: начиная движение от некоторого понятия, по дугам отношений можно достичь других понятий.
Возьмем, например, следующую фразу: «Программист сел за компьютер и отладил программу». Здесь выделяется три объекта: программист (a1), компьютер (a2) и программа (a3). Эти объекты связаны отношениями: сел за (r1), отладил (r2), загружена в (r3). К отношениям, явно выраженным в тексте, отнесено и отношение «загружена в» («программа загружена в компьютер»).
Использование
семантических моделей
К
основным достоинствам семантических
моделей можно отнести: представление
средств для выражения
Накладывая ограничения на описание вершины дуг, можно получить сети различного вида. Если вершины не имеют собственной внутренней структуры, то такие сети называют простыми. В противном случае они являются иерархическими сетями. Одно из основных отличий иерархических семантических сетей от простых состоит в возможности разделить сеть на подсети и установить отношения не только между вершинами, но и между пространствами.
Характерной особенностью некоторых семантических моделей является интегрированное описание процедурной семантики и статической семантики – допустимые операции над объектами определяются совместно с определением структур данных.
Наряду
с достоинствами семантические
модели обладают некоторыми недостатками.
В семантических сетях нет специальных
средств, позволяющих определить временные
зависимости, поэтому временные значения
и события трактуются как обычные понятия.
Произвольная структура и различные типы
вершин и связей усложняют процедуру обработки
информации. Стремление устранить эти
недостатки послужило причиной появления
особых типов семантических сетей: синтагматические
цепи, сценарии, фреймы и т.п.