Различные модели искусственного интеллекта, проблемы его создания и применения

Автор: Пользователь скрыл имя, 18 Ноября 2011 в 11:45, реферат

Краткое описание

Искусственный интеллект(ИИ), как и любое направление современной науки, имеет богатую предысторию. Знакомство с именами и трудами основоположников, их научными воззрениями, даже биографиями ученых имеет практический смысл, т. к. во многих случаях позволяет глубже понять смысл той или иной научной модели. Широкое развитие автоматизированных технологий началось, по–видимому, в 40–50 годах ушедшего XX века. Философская идея о замене человека “умной машиной”, возникшая в книгах Шелли (если не ранее), получила наибольшее распространение в 60–80 годах.

Оглавление

ВВЕДЕНИЕ……………………………………………………………………….….3
ПОНЯТИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА…………………………....4
Термины и определения ……………………………………………….…....4
Проблемы представления знаний………………………………...…..……..7
Современные области исследований в искусственном интеллекте...…...13
Современные теоретические проблемы искусственного интеллекта...…15
МОДЕЛИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА………………………...….18
Логическая модель………………………………………………………….18
Продукционная модель……………………………………………………..22
Фреймы………………………………………………………………………23
Семантические сети……………………………………………………...…25
Новые модели…………………………………………………………….…28
Критериальные методы………………………………………………28
Вероятностные методы……………………………………………….29
Нейронные сети……………………………………………………….30
ЗАКЛЮЧЕНИЕ……………………………………………………………………..32
БИБЛИОГРАФИЧЕСКИЙ СПИСОК……………………………………..………33

Файлы: 1 файл

Годовая работа по информатике.doc

— 277.50 Кб (Скачать)

      
 
 

Рис.7. Психика с точки зрения теории фреймов 

    Примечание. Марвин Мински — профессор компьютерных наук в Массачусетском технологическом институте США. Специалист в области искусственного интеллекта, когнитивной психологии, программирования для машины Тьюринга. Работал также в области вычислительной геометрии, вычислительной семантики, машинного восприятия, символического обучения. Привлекался к космическим проектам. Один из основателей робототехники и удаленного управления: лично разработал тактильные и зрительные датчики, механические части первых роботов. В 1951 г. создал одну из первых нейронных сетей. В 1959 г. основал лабораторию ИИ — M.I.T. Много работал над проблемами представления знаний для понимания языков и визуального восприятия. В 70–е гг. создал собственную психологическую теорию интеллекта. Всего опубликовал около 10 книг, каждая из которых имела успех, но наибольший следует признать, видимо, за монографией “Фреймы для представления знаний”, изданной в 1974 г. Учился в Нью–Йорке, ученые степени получил в Гарварде (1950) и Принстоне (доктор философии, 1954). Одним из преподавателей Марвина был Клод Шеннон — основоположник теории информации и один из первых математиков, работавших в области ИИ. Шеннон, например, изобрел первую программу для игры в шахматы (компьютер MANIAC, Los Alamos, 1956) и электронную мышь для решения задачи лабиринта. Мински и Шеннон — легенды истории вычислительной техники.

    В отличие от семантических сетей, разработанных первоначально для  узкой задачи анализа текстов и потому охватывающих только отдельные этапы психической деятельности, теория фреймов является достаточно полной. В ней рассматриваются не только процессы мышления (их также рассматривают силлогистика Аристотеля, семантические сети), но и восприятие, распознавание, мышление и воображение (как одна из высоких форм мышления). Истоки теории фреймов лежат, по–видимому, в области психологии.

    Современный тезис о параллельности мышления (“природной” параллельности процессов в мозге человека в силу огромного числа нейронов) в понимании М. Мински не является однозначным. Он признает параллельность за процессами высокого уровня (очень общего, и потому неприменимого к реальности без детализации), оперирующими некоторыми “глубинными структурами”. К таким процессам он относит процесс воображения. Мышление и распознавание считает процессами по своей природе последовательными, оговаривая, впрочем, ряд исключений. Логический подход к представлению знаний считает априорно ограниченным и применимым только к учебным задачам.

2.4. Семантические сети

    Термин  “семантическая (смысловая) сеть” (или “концепция слов”) возник в 1968–69 гг. в работах Р. Куиллиана. Он подразумевает целый класс общих подходов, для которых характерно использование графических схем с узлами, соединенными дугами (графов).

    Семантика — наука, устанавливающая отношения между символами и объектами, которые они обозначают, т. е. наука, определяющая смысл знаков.

    Семантическая сеть — это граф, вершины которого — понятия, а дуги — отношения между ними.

    Первоначально семантические сети были разработаны  для анализа естественных языков и построения психологических моделей человеческой памяти (задача автоматического перевода — положение Аристотеля о том, что “человек мыслит на языке”, задача подбора синонимов к заданному слову и др.). На этом этапе считалось, что в предложении есть некая “центральная тема”, “раскрутив” которую, машина может “понять” смысл (семантику) предложения (рис. 8).

      
 
 
 
 
 
 
 
 

Рис.8. Граф, иллюстрирующий предложение “весенним утром король взял слуг и отправился в лес на конную прогулку”

     Экспериментальную проверку теоретических  положений об устройстве человеческой памяти и организации логического  вывода Р. Куиллиан провел совместно с психологом А. Колинз (Allan Collins) в 1969–70 гг. на основе иерархической сети. Для такой сети характерны отношения вида класс—элемент класса; свойство—значение. Пример элемента класса приведен на рис 9, 10.

    Дальнейшее  развитие модели связано с именами Р. Симмонса (Robert Simmons), С. Шапиро (Stuart С. Shapiro, обратил внимание на наличие “отношений разного рода”), Хендрикса (Hendrix, ввел понятие “разделенной сети/partitioned network”) и Шенка (Roger С. Schank, ввел понятия “концептуальной зависимости” и “концептуальных примитивов”).

    

      

    

Рис.10. Семантическая сеть “автомобиль” и подсеть “двигатель передает

усилие колесам”

    В сетях Р. Симмонса нет строгой  иерархии, поскольку он решал несколько  другую задачу: понять значение предложения  путем “развертывания/дополнения” глаголов. То есть от глагола строил собственную “дополнительную сеть”, включающую в себя “варианты использования” данного глагола. Соответственно получена и классификация узлов: агент, реципиент, объект.

    Узлы  в семантической сети обычно соответствуют  объектам, концепциям, событиям или понятиям. Дуги могут быть определены разными методами, зависящими от метода представления знаний. Любой фрагмент сети, например одна вершина, две вершины и соединяющие их дуги, называют подсетью. Логический вывод (поиск решения) на семантической сети заключается как раз в том, чтобы найти или сконструировать подсеть, удовлетворяющую некоторым условиям. Для того чтобы формализовать этот процесс, вводят типизацию семантических сетей и затем разрабатывают методы решения для сетей конкретного вида (на основе анализа математических свойств отношений, входящих в сеть).

    Сети  конкретного вида в совокупности с методами вывода на них иногда называют именами первооткрывателей.

    Сети  различного вида получаются и в зависимости  от того, какие ограничения накладываются на вершины и дуги. Если вершины сети не обладают внутренней структурой, то такие сети называют простыми сетями, если вершины обладают внутренней структурой, то такие сети называют иерархическими. Динамические семантические сети (сценарии) — это сети с событиями. Одно из основных отличий иерархической сети от простой сети — в возможности разделять сеть на подсети и устанавливать отношения не только между вершинами, но и между подсетями. Различные подсети, существующие в сети, могут быть упорядочены в виде дерева подсетей, вершины которого — подсети, а дуги — отношения видимости. Понятие подсети аналогично понятию скобок в математической нотации, понятие видимости — понятию переменных, находящихся внутри и снаружи скобок.

    2.5. Новые модели

    Основные  модели представления знаний, перечень ценных задач и методы их решения сформировались, в основном, к началу 80–х гг. прошлого века. В развитии теории и практики ИИ наступил некоторый застой, связанный с тем, что дальнейшее совершенствование традиционных моделей не давало качественного скачка.

    В начале 90–х гг. философское понимание задач и методов ИИ несколько изменилось, что сразу же привело к появлению ряда новых моделей: критериального языка описания выбора, нейронных сетей, ряда вероятностных моделей. Следует сказать, что далеко не все специалисты по ИИ готовы признать их полноценными моделями для представления знаний, хотя бы в силу того, что эти модели не способны обосновывать свои выводы. Кроме того, «новыми» их можно назвать с большой натяжкой; критериальному языку, например, уже насчитывается несколько сотен лет.

    Итак, новый взгляд на понятие “модель для представления знаний” состоит в том, что имеется в виду некоторая модель, позволяющая получать “хорошие решения”. При этом не важно, моделирует ли она способ мышления человека и способна ли пояснять свои выводы .

    2.5.1. Критериальные методы

    На  практике применение интеллектуальных, нечетких (в первую очередь) моделей  часто необходимо для оценки альтернатив  и выбора наилучшей в некотором смысле. Необходимость их применения обусловлена большим количеством альтернатив, учитываемых параметров, требованием “проиграть несколько сценариев развития событий”; например, “благоприятный, обычный и наихудший”.

    Выбор в этом случае может осуществляться осмысленно, на основе учета всех “за” и “против”, либо случайным образом (например, по аналогии с кем–то). Следует заметить, что для больших систем логические обоснования, которые способен предоставить человек–эксперт, не намного надежнее случайного выбора, а часто менее надежны. Это связано, прежде всего, с тем, что человек не способен одновременно удерживать в памяти большое количество фактов, причин, целей, а современные задачи (например, экономические) требуют именно этого.

    Предположим, что некоторый служащий в банке  принимает решение о кредитовании предприятия, находящегося в неустойчивом положении. В случае, если в кредите будет отказано и предприятие преодолеет трудности самостоятельно, банк не получит прибыль. Если же предприятие разорится, банк понесет убытки. Если кредит будет выдан под значительный залог — предприятие откажется его брать. Достаточно ли интуиции служащего и имеющейся бухгалтерской документации для принятия решения?

    Для описания и решения подобных задач  создана специальная модель — языки описания выбора. Задачи выбора чрезвычайно многообразны, различны и методы их решения.

    2.5.2. Вероятностные методы

    Широкий класс подходов использует в качестве меры близости альтернатив вероятностные оценки. В настоящее время методы, позволяющие оценить вероятные исходы того или иного решения, его правильность, исследуют в рамках так называемой теории рисков. Теория носит прикладной характер, поэтому обычно говорят о рисках в предметной области, например в природопользовании. В математическом плане это обыкновенная теория вероятностей, причем в ее самых простых проявлениях. Суть теории рисков составляют не математические, а алгоритмические процедуры, связанные с особенностями измерения и вероятностной обработки данных в конкретной предметной области, а также интерпретации полученных результатов.

    Рассмотрим  простейший, но полезный и практически  ценный пример применения методов теории вероятностей к задаче постановки медицинского диагноза. В качестве “решающего правила” используем формулу условной вероятности Байеса:

    

    Формула условной вероятности позволяет  вычислить вероятность события  А при условии, что произошло событие В, т. е. Р(А/В) на основании имеющихся до опыта (априорных) вероятностей Р(А) и Р(В/А). Суммирование в знаменателе формулы проводится по всем гипотезам в полной группе событий.

    Пример 1. Необходимо вычислить вероятность того, что пациент болеет ангиной при условии, что наблюдается повышение температуры. Если пациент не болеет ангиной, то он болеет “не ангиной”, например здоров.

      
 

Априорные вероятности Р(Ангина) и Р(Температура/Ангина) могут быть получены из анализа медицинской статистики для данной местности. Если, согласно записям в поликлинике, из 10000 больных в этот период года 7000 перенесли ангину, то априорная вероятность Р(Ангина) = 0,7. Изучение медицинской литературы позволит установить также и Р(Температура/Ангина), равной, например, значению 0,8.

    Т. к. Р(Ангина) = 0,7, следовательно Р(Не ангина) = 0,3. Несколько сложнее с Р(Температура/Не ангина), в худшем случае придется оценить при помощи экспертов(врачей). Аналогично получим оценки для знаменателя, а затем общий результат

2.5.3. Нейронные сети

    Одним из наиболее активно развиваемых  сегодня направлений в ИИ являются нейронные сети — модель, представляющая собой в некотором смысле гибрид критериальных, вероятностных и логических методов. Можно также провести аналогию с правилами продукций. Нейронная сеть — это в некотором смысле “числовая запись” правил “если/то”, рассмотренных в п. 2.2.

    Развитие  теории началось в 1943 г. с работ У. Макклоха (W. McCulloch) и У. Питтса (W. Pitts), рассматривающих функционирование головного мозга. В 1957 г. психолог Фрэнк Розенблатт (Корнелл, США) создал “персептрон” — электромеханическое устройство, моделирующее глаз улитки и его взаимодействие с мозгом. Модель различала буквы алфавита, но оказалась чувствительна к написанию. Буквы А, А и А для персептрона — это три разных знака.

    В 1969 г. вышла классическая работа “Персептроны”, в которой М. Мински и С. Пайперт доказали ряд теорем об ограниченных возможностях распознавания образцов с использованием персептрона. Фактически, они ввели в ИИ требование строгого математического обоснования используемых методов. Далее начала развиваться современная теория нейросетей, персептроны в классическом виде вышли из применения. В России в настоящий момент сильной считается красноярская школа нейроинформатики (например, Горбань А.Н., 1990).

Информация о работе Различные модели искусственного интеллекта, проблемы его создания и применения