Автор: Пользователь скрыл имя, 17 Сентября 2013 в 12:10, курсовая работа
В связи с совершенствованием технологий записи и хранения данных на людей обрушились колоссальные потоки информационной руды в самых различных областях. Деятельность любого предприятия (коммерческого, производственного, медицинского, научного и т.д.) теперь сопровождается регистрацией и записью всех подробностей его деятельности. Что делать с этой информацией? Стало ясно, что без продуктивной переработки потоки сырых данных образуют никому не нужную свалку.
Специфика современных требований к такой переработке следующие:
данные имеют неограниченный объем;
данные являются разнородными (количественными, качественными, текстовыми);
результаты должны быть конкретны и понятны;
Введение 3
1 Методы извлечения знаний 5
2 Работа с экспертами и проблема извлечения знаний 18
3 Автоматизация извлечения знаний и формирования модели 23
4 Теоретические аспекты получения знаний 29
4.1 Психологический аспект 32
4.2 Лингвистический аспект 37
4.3 Гносеологический аспект 41
Заключение 47
Список литературы
Внутренняя согласованность. Этот критерий в эмпирических областях на первый взгляд просто не работает: в них факты часто не согласуются друг с другом, определения противоречивы, диффузны и.т.д. Аналитику, знающему особенности эмпирического знания, его модальность, противоречивость и неполноту, приходится сглаживать эти "шероховатости" эмпирики.
Модальность знания означает возможность его существования в различных категориях, т.е. в конструкциях существования и долженствования. Таким образом, часть закономерностей возможна, другая обязательна и.т.д. Кроме того, приходится различать такие оттенки модальности, как: эксперт знает, что ...; эксперт думает, что ...; эксперт хочет, чтобы...; эксперт считает, что ...
Возможная противоречивость эмпирического знания - естественное следствие из основных законов диалектики, и противоречия эти невсегда должны разрешаться в поле знаний, а напротив, именно противоречия служат чаще всего отправной точкой в рассуждениях экспертов.
Неполнота знания связана с невозможностью полного описания предметной области. Задача аналитика эту неполноту ограничить определенными рамками "полноты", т.е. сузить границы предметной области, либо ввести ряд ограничений и допущений, упрощающих проблему.
Системность. Системно-структурный подход к познанию (восходящий еще к Гегелю) ориентирует аналитика на рассмотрение любой предметной области с позиций закономерностей системного целого и взаимодействия составляющих его частей. Современный структурализм исходит из многоуровневой иерархической организации любого объекта, т.е. все процессы и явления можно рассматривать как множество более мелких подмножеств (признаков, деталей) и, наоборот, любые объекты можно (и нужно) рассматривать как элементы более высоких классов обобщений.
Объективность. Процесс познания глубоко субъективен, т.е. он существенно зависит oт особенностей самого познающего субъекта. Субъективность начинается уже с описания фактов и увеличивается по мере углубления идеализации объектов.
Следовательно, более корректно говорить о глубине понимания, чем об объективности знания. Понимание - это сотворчество, процесс истолкования объекта с точки зрения субъекта. Это сложный и неоднозначный процесс, совершающийся в глубинах человеческого сознания и требующий мобилизации всех интеллектуальных и эмоциональных способностей человека. Все свои усилия аналитик должен сосредоточить на понимании проблемы. В психологии подтверждается факт, что люди, быстро и успешно решающие интеллектуальные задачи, большую часть времени тратят на понимание ее, в то время как быстро приступающие к поискам решения, чаще всего не могут его найти.
Историзм. Этот критерий связан с развитием. Познание настоящего есть познание породившего его прошлого. И хотя большинство экспертных систем дают "горизонтальный" срез знаний - без учета времени (в статике), инженер по знаниям должен всегда рассматривать процессы с учетом временных изменений - как связь с прошлым, так и связь с будущим. Например, структура поля знаний и база знаний должны допускать подстройку и коррекцию, как в период разработки, так и во время эксплуатации экспертной системы.
Структура познания
Рассмотрев основные критерии научности познания, попытаемся теперь описать его структуру. Методологическая структура познания может быть представлена как последовательность этапов (рисунок 12), которые рассмотрим с позиций инженера по знаниям.
Описание и обобщение фактов. Это как бы "сухой остаток" бесед аналитика с экспертом. Тщательность и полнота ведения протоколов во время процесса извлечения и пунктуальная "домашняя работа" над ними - вот залог продуктивного первого этапа познания.
На практике оказывается трудным придерживаться принципов объективности и системности, описанных выше. Чаще всего на этом этапе факты просто собирают и как бы бросают в "общий мешок"; опытный инженер по знаниям часто сразу пытается найти "полочку" или "ящичек" для каждого факта, тем самым подспудно готовясь к этапу концептуализации.
Рисунок 12 - Структура познания
Установление связей и закономерностей. В голове эксперта связи установлены, хотя часто и неявно; задача инженера - выявить каркас умозаключений эксперта. Реконструируя рассуждения эксперта, инженер по знаниям может опираться на две наиболее популярные теории мышления - логическую и ассоциативную. При этом, если логическая теория благодаря горячим поклонникам в лице математиков широко цитируется и всячески эксплуатируется в работах по искусственному интеллекту, то вторая, ассоциативная, менее известна и популярна, хотя имеет также древние корни. Красота и стройность логической теории не должны заслонять печального факта, что человек редко мыслит в категориях математической логики.
Ассоциативная теория представляет мышление как цепочку идей, связанных общими понятиями. Основными операциями такого мышления являются ассоциации, приобретенные на основе различных связей; припоминание прошлого опыта; пробы и ошибки со случайными успехами; привычные ("автоматические") реакции и пр.
Построение идеализированной модели. Для построения модели, отражающей представление субъекта о предметной области, необходим специализированный язык, с помощью которого можно описывать и конструировать те идеализированные модели мира, которые возникают в процессе мышления. Язык этот создается постепенно с помощью категориального аппарата, принятого в соответствующей предметной области, а также формально-знаковых средств математики и логики. Для эмпирических, предметных областей такой язык пока не разработан, и поле знаний, которое полуформализованным способом опишет аналитик, может быть первым шагом к созданию такого языка.
Объяснение и предсказание моделей. Этот завершающий этап структуры познания является одновременно и частичным критерием истинности полученного знания. Если выявленная система знаний эксперта полна и объективна, то на ее основании можно делать прогнозы и объяснять любые явления из данной предметной области. Обычно базы знаний экспертных систем страдают фрагментарностью и модульностью (несвязанностью) компонентов. Все это не позволяет создавать действительно интеллектуальные системы, которые, равняясь на человека, могли бы предсказывать новые закономерности и объяснять случаи, не указанные в явном виде в базе. Исключением тут являются системы формирования знаний, которые ориентированы на генерацию новых знаний и "предсказание".
В заключение перечислим наиболее часто встречающиеся неудачи, связанные с гносеологическими проблемами инженерии знаний:
ЗАКЛЮЧЕНИЕ
В настоящее время большинство разработчиков экспертных систем отмечает, что процесс извлечения знаний остается самым «узким» местом при построении промышленных экспертных систем. При этом приходится самостоятельно разрабатывать методы извлечения, сталкиваясь со следующими трудностями:
Процесс извлечения знаний – это длительная и трудоемкая процедура, в которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной психологии, системному анализу, математической логике и прочие, необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решений.