Методы извлечения знаний

Автор: Пользователь скрыл имя, 17 Сентября 2013 в 12:10, курсовая работа

Краткое описание

В связи с совершенствованием технологий записи и хранения данных на людей обрушились колоссальные потоки информационной руды в самых различных областях. Деятельность любого предприятия (коммерческого, производственного, медицинского, научного и т.д.) теперь сопровождается регистрацией и записью всех подробностей его деятельности. Что делать с этой информацией? Стало ясно, что без продуктивной переработки потоки сырых данных образуют никому не нужную свалку.
Специфика современных требований к такой переработке следующие:
данные имеют неограниченный объем;
данные являются разнородными (количественными, качественными, текстовыми);
результаты должны быть конкретны и понятны;

Оглавление

Введение 3
1 Методы извлечения знаний 5
2 Работа с экспертами и проблема извлечения знаний 18
3 Автоматизация извлечения знаний и формирования модели 23
4 Теоретические аспекты получения знаний 29
4.1 Психологический аспект 32
4.2 Лингвистический аспект 37
4.3 Гносеологический аспект 41
Заключение 47
Список литературы

Файлы: 1 файл

kurs_intell_tekhn.docx

— 894.47 Кб (Скачать)

Простейший алгоритм извлечения знаний из текстов включает следующие шаги:

    1. Составить «базовый» список литературы для ознакомления с предметной областью.
    2. Выбрать текст для извлечения знаний.
    3. Беглое знакомство с текстом. Провести консультации со специалистами для определения значений незнакомых слов.
    4. Сформировать первую гипотезу о макроструктуре текста.
    5. Внимательно прочитать текст и выписать ключевые слова и выражения, определив тем самым «смысловые вехи».
    6. Определить связи между ключевыми словами, разработать макроструктуры текста в форме графа или реферата.
    7. Сформировать новое представление знаний на основании макроструктуры текста.

 

 

 

 

 

 

2 Работа с экспертами и проблема извлечения знаний

 

Интеллектуальные  системы создаются совместно  со специалистами, которые передают свои знания о процессах и объектах, поясняют схему рассуждений по выбору решений конкретных задач, приводят неформализуемые факторы, которые необходимо учитывать. Процесс работы с экспертами или специалистом состоит в извлечении знаний или, более корректно, приобретении знаний. Процесс этот сложный, трудоемкий, содержит факторы технического, психологического, производственного и социального характера. Большую роль в данном процессе играет инженер знаний. В течение долгого времени он работает совместно с экспертом, определяя задачи, выявляя наиболее важные понятия, определяя и формулируя правила отношений между понятиями. Инженер знаний должен хорошо знать предметную область, владеть методами формализации и представления знаний, другим инструментарием искусственного интеллекта, быть психологом, быстро ориентироваться в различных ситуациях.

Эксперт должен желать и быть в состоянии  помочь в изучении предметной области. Он должен осознавать, что интеллектуальные системы призваны помочь им в практической деятельности, а не вытеснять их.

Инженеру  знаний обычно приходится работать с  плохо определенными задачами, в  которых отсутствует детерминированная  внутренняя структура. В своей практической деятельности эксперты при решении  этих задач используют эвристики - эмпирические правила, применяемые в случаях, когда условия оперативности решения задачи или недостаточное понимание существа проблемы делают невозможным анализ всех параметров задачи. Поэтому в интеллектуальных системах для решения задач стремятся заложить эвристические процедуры.

Трудным моментом в работе инженера знаний является оказание помощи эксперту при  попытках структурировать предметные знания, определить и формализовать  предметные концепции.

Работа, связанная с получением знаний, имеющихся  у конкретного лица, т.е. извлечение знаний, в инженерии знаний имеет  немаловажное значение. Необходимостью извлечения знаний специалиста разработчиком интеллектуальной системы нельзя пренебрегать не только из-за того, что полностью автоматизировать этот процесс необычайно сложно, но из теоретических соображений.

В чем  особенность извлечения знаний для  интеллектуальных и экспертных систем? Ответ можно получить, ответив на другой вопрос: «Откуда, что и как извлекать?».

Откуда извлекать знания? Как отмечалось выше, источниками знаний для интеллектуальных и экспертных систем могут быть учебники, справочники, материалы конкретных исследований в проблемной области, экономическая информация и т.п.

Тем не менее, классический источник знаний –  это эксперт в данной области, знания которого получает разработчик систем, выступающий в роли инженера знаний.

Кто же такой эксперт? Это либо специалист высокой квалификации в отличие от обычного исполнителя, либо человек с опытом в отличие от новичка.

Изучение  общих особенностей эксперта – это  не только одна из возможных целей, к которой следует стремиться в человеко-машинных системах, состоящих из интеллектуальной системы (или ЭС) и пользователя, это важно для того, чтобы заранее знать особенности партнера, от которого мы будем получать знания.

Известно, что чем выше способности эксперта в проблемной области, тем более  он не способен к описанию знаний, используемых им для решения задачи. Уотермен назвал это парадоксом инженерии знаний. Если спросить у эксперта, что он конкретно делает, решая задачу, то он объяснит наиболее правдоподобный, по его мнению, но совершенно отличный от реального процесс рассуждений, поэтому здесь нужно быть осторожным.

Существует  мнение, что знания эксперта систематизируются  вместе с внешней моделью задачи и мгновенно выбираются из памяти в ответ на каждую конкретную ситуацию и лишь в ситуации, с которой эксперт сталкивается впервые, порядок их выборки будет определяться сознательно но наиболее общим закономерностям.

Какие знания извлекать (что извлекать?). Если функции системы уже определены, то естественно, самое важное – получить правила выводов, которые необходимы для реализации этих функций.

Прежде  всего, это базовая структура. Важно перечислить объекты, понятия и атрибуты, которые формируют базовую структуру проблемной области, и знать свойства области. Связь между объектами, понятиями и атрибутами организуется через правила вывода.

Далее, критерии разумности, т.е. почему эксперт решает некоторую проблему именно данным способом? Может быть, этот способ имеет высокую эвристическую ценность, а может, подготовлен на случай неудачи? Какая этому способу нужна поддержка?

Средства, используемые экспертом, например модели принятия решений, используемые им при принятии решений.

Как извлекать знания? В таблице 5 приведены основные методы извлечения знаний из предметного эксперта и их описание.

Таблица 5 – Методы извлечения знаний

Методы извлечения знаний из предметного эксперта

Описание

Наблюдение на рабочем месте

Наблюдать за экспертом, решающим реальные задачи на своем рабочем месте.

Обсуждение задач

Выявить виды данных, знаний и процедур, необходимых для решения конкретных задач.

Описание задач

Попросить эксперта описать прототипную  задачу для каждой категории возможных  ответов.

Анализ задачи

Представить эксперту ряд реалистических задач для решения вслух с  целью выявить логические основания конкретных шагов рассуждения.

Доводка системы

Попросить эксперта предоставить вам  несколько задач для решения и с использованием правил, выявленных во время интервью.

Оценивание системы

Попросить эксперта проверить работу системы и подвергнуть критике правила и структуру управления прототипной системой.

Проверка системы

Предоставить примеры, решенные экспертом  и прототипом системы, другим независимым  экспертам для сравнения и  оценки.


 

Технику извлечения знаний можно разделить на шесть основных классов: опрос с наводящими вопросами, структурированный опрос, самонаблюдение, самоотчет, диалог, критический обзор. Каждый класс, в свою очередь, состоит из нескольких технических методов. Подробную информацию мы рассматривать не будем, укажем только, что цель извлечения знаний может быть достигнута различными способами в зависимости оттого, как эти знания будут анализироваться.

Эксперт, способный работать с вычислительной техникой, может также взаимодействовать  с интеллектуальной системой непосредственно  через редактирующую программу. Эта программа должна обладать развитым диалоговым интерфейсом и знаниями о структуре БЗ. Однако возникает проблема эффективности взаимодействия эксперта с программой.

Еще одним  способом приобретения знаний системой является автоматизация извлечения знаний и запись их в БЗ. Неавтоматизированный сбор знаний специалистов — трудоемкий процесс. В связи с этим в развитых интеллектуальных системах предусматриваются вспомогательные средства для приобретения знаний.

Интернет  или Интранет также могут использоваться для облегчения процесса извлечения знаний. Электронное интервьюирование может проводиться, если инженер знаний и эксперты находятся в различных местах. Также, эксперты могут утверждать и сопровождать базы знаний на расстоянии. Посредством Интернет могут быть достигнуты документированные знания. Проблемой является идентификация знаний: задача, которая может быть облечена интеллектуальными агентами.

Актуальной  является также задача автоматической структуризации неформальных знаний, доступных в Интернет через распределенную гипермедиа систему – Web. Технология гипермедиа через Web обеспечивает идеальный подход для развития систем, основанных на знаниях путем расширения возможностей каналов человеко–машинного взаимодействия. Этот новый подход к интеграции технологии гипермедиа с извлечением знаний имеет дело со знаниями до того, как они будут формализованы.

Многие Web–механизмы поиска включают интеллектуальных агентов для идентификации и поставки требуемой информации по индивидуальным потребностям и запросам.

Причина экспоненциального роста количества информации, обеспечиваемого через Web-механизмы, вызывает развитие методов структуризации информации в распределенных гипермедиа системах.

Такая интеграция между технологией гипермедиа и  методами извлечения знаний может обеспечить мощный инструмент для извлечения знаний.

 

 

 

 

 

 

 

 

 

 

 

 

 

3 АВТОМАТИЗАЦИЯ ИЗВЛЕЧЕНИЯ ЗНАНИЙ

И ФОРМИРОВАНИЯ МОДЕЛИ

 

Практический  опыт решения задачи приобретения знаний привел к развитию методов и программных средств, призванных упростить процесс приобретения знаний. Эти средства и методы для приобретения знаний могут быть разделены на три категории: редакторы и интерфейсы для формирования баз знаний, средства для объяснения различных аспектов работы, средства для модификации баз знаний.

Рассмотрим  процесс автоматизации извлечения знаний, формирования модели и заполнения БЗ в интеллектуальной системе прогнозирования  для решения задач оперативного планирования и диспетчерского управления многостадийной системы дискретного производства.

Краткая характеристика проблемной области.

Многостадийная  производственная система состоит  из подсистемы механической обработки деталей, сборки агрегатов и окончательной сборки готового изделия.

Подсистема  механической обработки представляет собой производственную линию, построенную как поточная. Каждому центру обработки такой линии предоставляются станки с одними и теми же рабочими характеристиками. Работа подсистемы организуется таким образом, что сначала производятся установка и настройка, а затем детали подвергаются механической обработке,

В подсистеме сборки полуфабрикаты не могут храниться  на линии сборки, а некоторые виды деталей собираются с помощью операций установки.

Составление оперативного плана, эффективно координирующего  работу подсистем многостадийной производственной системы, связано с рядом проблем;

1. Проблема  распределения: какие типы деталей  или изделий будут назначены для обработки на каждой производственной линии, если каждая подсистема состоит из одной или более линий?

2. Проблема  принятия решений относительно  размера партии: какое следует принять решение относительно размера партии изделий, для которой составляется план?

3. Проблема  диспетчеризации: в какой последовательности  следует обрабатывать изделия на каждой производственной линии; возможность возникновения непредвиденных и аварийных ситуаций, и т. д.

Целевыми  показателями данной многостадийной производственной системы являются: загрузка каждой линии; уровень запасов, имеющийся между подсистемами; среднее запаздывание в выполнении заказов; общие издержки производства, включающие в себя эксплуатационные расходы, издержки на наладочные работы, текущие издержки на поддержание запасов и убытки, связанные с просрочкой заказов.

Решение в системе принимает управленческий персонал, связанный с разными  сторонами производственного цикла.

Характеристика интеллектуальной системы прогнозирования.

Эта система  предназначена для прогнозирования  ситуаций и их развития, объяснения и обоснования прогноза, а также  выдачи рекомендации по устранению возникающих «узких мест» и нежелательных ситуаций при решении задач диспетчеризации и оперативного планирования производства.

В системе  знания экспертов о производственном процессе представлены в виде правил «Если ...Тогда ...» . При решении задачи система имитирует рассуждения человека-эксперта. Знания эксперта о процессе и его основных закономерностях расположены в двух БЗ, в которых сосредоточены как знания, связанные с прогнозированием развития ситуаций на производстве, так и рекомендации по устранению «узких мест».

Информация о работе Методы извлечения знаний