Контрольная работа по "Интеллектуальной информационой системе"

Автор: Пользователь скрыл имя, 02 Ноября 2012 в 14:14, контрольная работа

Краткое описание

Решение задачи по "Интеллектуальным информационным системам".

Файлы: 1 файл

контрольная работа 1091 ДУ Ахтямова А.С.doc

— 580.00 Кб (Скачать)



                                                            

 

   

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

После начального разбиения  все узлы потомки будут содержать  по несколько наблюдений из исходного  множества, и для каждого узла затем будет повторен процесс  выбора атрибута разбиения. Поскольку узел-потомок Т1, полученной  в ветви для значения А, содержит  33 наблюдения, которые относятся к одному классу, то энтропия равна 0, узел объявляется листом и дальнейшее ветвление для него не проводится.

 

Этап 2 . Для узла Т2, включающего 58 наблюдений, может быть сделана проверка по оставшимся атрибутам. Оптимальное разбиение будет достигнуто с помощью атрибута А4  для альтернативных вариантов А4<=1 или А4>1. В соответствии с формулой энтропии можно записать:

 InfoS3 (T1)=-(39/58)*log2(39/58)-(19/58)*log2(19/58)= 0,142бит

При использовании атрибута А4 для разбиения Т2 с порогом 1 получим чистые узлы, поэтому InfoS4 (T2) =0. Прирост информации, обеспеченный данным разбиением составит  Gain(S4)= 0,14-0 = 0,14 бит и будет максимальным.

 

Т2

Info (T2)

А4

Gain(S4(А4))=0,14

0


 


 А1


 А1


 


A4<=1 А4>1

   


 

 

 

 

 

 

 

 

Задача 2

Разбиение

левый потомок

правый потомок

1

возраст<=30

возраст>=30

2

пол = женский

пол=мужской

3

брак=нет

брак=да

4

иждивенцы<=1

иждивенцы>=1

5

доход<=10000

доход>=10000

6

опыт работы<=10

опыт работы>=10

7

срок проживания<=10

срок проживания>=10

8

недвижимость<=0

недвижимость>=0

9

месячный платеж<=5000

месячный платеж>=5000


 

Результаты расчета  компонентов

PL

PR

P(j/tL)

P(j/tR)

2* PL* PR

W(s/t)

Q(s/t)

плохой

хороший

плохой

хороший

1

0,33

0,67

0,4

0,6

0,508

0,492

0,442

0,216

0,096

2

0,33

0,67

0,5

0,5

0,475

0,525

0,442

0,05

0,022

3

0,352

0,648

0,531

0,469

0,458

0,542

0,456

0,144

0,066

4

0,681

0,319

0,419

0,581

0,586

0,414

0,434

0,334

0,145

5

0,352

0,648

1

0

0,271

0,729

0,456

1,208

0,551

6

0,374

0,626

0,529

0,471

0,456

0,544

0,468

0,146

0,068

7

0,517

0,483

0,489

0,511

0,477

0,523

0,499

0,024

0,012

8

0,637

0,363

0,552

0,448

0,364

0,636

0,462

0,376

0,173

9

0,659

0,341

0,433

0,567

0,581

0,419

0,449

0,296

0,133


 

 

 

 

 

Доход


    да                                            нет

                                      доход >10000                                 

 

хороший класс                                             

                                        плохой класс                                               заемщика

                                                                                                                                                                                    

Тридцать три записи, в которых доход <=10000 и по этой причине оказавшиеся в правом узле, содержат одну и ту же целевую переменную, указывающую на плохой класс заемщика. Т.о. узел является чистым. узел будет объявлен листом, и дальнейшее разбиение по данной ветви проводится не будет. Записи в левом узле относятся к различным классам. Потребуется дальнейшее их разбиение.

PL

PR

P(j/tL)

P(j/tR)

2* PL* PR

W(s/t)

Q(s/t)

плохой

хороший

плохой

хороший

1

0,31

0,69

0,278

0,722

0,275

0,725

0,428

0,012

0,005

2

0,31

0,69

0,222

0,778

0,3

0,7

0,428

0,156

0,067

3

0,31

0,69

0,389

0,611

0,225

0,775

0,428

0,328

0,14

4

0,655

0,345

0,158

0,842

0,5

0,5

0,452

0,684

0,309

6

0,328

0,672

0,316

0,684

0,256

0,744

0,441

0,12

0,053

7

0,552

0,448

0,344

0,656

0,192

0,808

0,496

0,304

0,151

8

0,586

0,414

0,324

0,676

0,208

0,792

0,485

0,232

0,113

9

0,638

0,362

0,216

0,784

0,381

0,619

0,462

0,33

0,152


 

                                                 

 

 

Доход <= 10000                  


    нет                                            да

                          Иждивенцы<=1                   плохой класс                                             

             нет                                          да               заемщика


                                                                                

иждивенцы>1                                                                                                                                                                                                      

                                                                                  плохой класс заемщика

                                                                                   

PL

PR

P(j/tL)

P(j/tR)

2* PL* PR

W(s/t)

Q(s/t)

плохой

хороший

плохой

хороший

1

0,33

0,67

1

0

0,75

0,25

0,442

0,5

0,221

2

0,167

0,833

1

0

0,8

0,2

0,278

0,4

0,111

3

0,33

0,67

1

0

0,75

0,25

0,442

0,5

0,221

6

0,25

0,75

1

0

0,778

0,222

0,375

0,444

0,167

7

0,67

0,33

0,75

0,25

1

0

0,442

0,5

0,221

8

0,75

0,25

0,889

0,111

0,67

0,33

0,375

0,222

0,083

9

0,67

0,33

0,75

0,25

1

0

0,442

0,5

0,221


 

 

 

 

 

 

 

 

 

 

Доход <= 10000                  


    нет                                            да

                          Иждивенцы<=1                   плохой класс                                             

             да                                           нет                заемщика


                                                                                

 

 

   месячный платеж<= 5000                   плохой класс заемщика                                                                         


  да                                                нет              

 

месячный платеж<=5000 плохой класс заемщика

 

 

PL

PR

P(j/tL)

P(j/tR)

2* PL* PR

W(s/t)

Q(s/t)

плохой

хороший

плохой

хороший

1

0,375

0,625

1

0

0,6

0, 4

0,469

0,8

0,375

2

0,125

0,875

1

0

0,714

0,286

0,219

0,572

0,125

3

0,25

0,75

1

0

0,67

0,33

0,375

0,66

0,248

6

0,25

0,75

1

0

0,67

0,33

0,375

0,66

0,248

7

0,75

0,25

0,67

0,33

1

0

0,375

0,66

0,248

8

0,75

0,25

0,833

0,167

0,5

0,5

0,375

0,666

0,25


                                                                                

 

 

 

 

 

 

Доход <= 10000                  


    нет                                           да

                          Иждивенцы<=1                   плохой класс                                             

             да                                           нет                заемщика


                                                                                

 

 

   месячный платеж<= 5125                   плохой класс заемщика                                                                         


  да                                                нет              

 

плохой класс заемщика

 возраст<=30              нет                                 


 

                            плохой класс заемщика

                                                          

 возраст<=30

 

                                                                              

 

 

 

 

 

   

PL

PR

P(j/tL)

P(j/tR)

2* PL* PR

W(s/t)

Q(s/t)

плохой

хороший

плохой

хороший

2

0,2

0,8

1

0

0,5

0,5

0,32

1

0,32

3

0,2

0,8

1

0

0,5

0,5

0,32

1

0,32

7

0,6

0,4

0,33

0,67

1

0

0,48

1,34

0,643

8

0,8

0,2

0,75

0,25

0

1

0,32

1,5

0,48


 

 

 

 

 

Доход <= 10000                  


    нет                                            да

                          Иждивенцы<=1                            плохой класс                                             

             да                                           нет                заемщика


                                                                                

                                                                           

   месячный платеж<= 5000                  плохой класс заемщика                                                                         


  да                                                нет              

 

плохой класс заемщика

 возраст<=30              нет                                 


да                                                                          

                            плохой класс заемщика

                                                          

срок прожив<=10         нет                   


да плохой класс заемщика

срок прожив<=10                                 

 

 

PL

PR

P(j/tL)

P(j/tR)

2* PL* PR

W(s/t)

Q(s/t)

плохой

хороший

плохой

хороший

2

0,33

0,67

1

0

0

1

0,442

2

0,884

8

0,67

0,33

0,4

0,6

0,5

0,5

0,442

1

0,442

Информация о работе Контрольная работа по "Интеллектуальной информационой системе"