Автор: Пользователь скрыл имя, 02 Ноября 2012 в 14:14, контрольная работа
Решение задачи по "Интеллектуальным информационным системам".
После начального разбиения все узлы потомки будут содержать по несколько наблюдений из исходного множества, и для каждого узла затем будет повторен процесс выбора атрибута разбиения. Поскольку узел-потомок Т1, полученной в ветви для значения А, содержит 33 наблюдения, которые относятся к одному классу, то энтропия равна 0, узел объявляется листом и дальнейшее ветвление для него не проводится.
Этап 2 . Для узла Т2, включающего 58 наблюдений, может быть сделана проверка по оставшимся атрибутам. Оптимальное разбиение будет достигнуто с помощью атрибута А4 для альтернативных вариантов А4<=1 или А4>1. В соответствии с формулой энтропии можно записать:
InfoS3 (T1)=-(39/58)*log2(39/58)-(19/
При использовании атрибута А4 для разбиения Т2 с порогом 1 получим чистые узлы, поэтому InfoS4 (T2) =0. Прирост информации, обеспеченный данным разбиением составит Gain(S4)= 0,14-0 = 0,14 бит и будет максимальным.
Т2 |
Info (T2) | |
А4 |
Gain(S4(А4))=0,14 |
0 |
А1=А
А1=С
A4<=1 А4>1
Задача 2
Разбиение |
левый потомок |
правый потомок |
1 |
возраст<=30 |
возраст>=30 |
2 |
пол = женский |
пол=мужской |
3 |
брак=нет |
брак=да |
4 |
иждивенцы<=1 |
иждивенцы>=1 |
5 |
доход<=10000 |
доход>=10000 |
6 |
опыт работы<=10 |
опыт работы>=10 |
7 |
срок проживания<=10 |
срок проживания>=10 |
8 |
недвижимость<=0 |
недвижимость>=0 |
9 |
месячный платеж<=5000 |
месячный платеж>=5000 |
Результаты расчета компонентов
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
1 |
0,33 |
0,67 |
0,4 |
0,6 |
0,508 |
0,492 |
0,442 |
0,216 |
0,096 |
2 |
0,33 |
0,67 |
0,5 |
0,5 |
0,475 |
0,525 |
0,442 |
0,05 |
0,022 |
3 |
0,352 |
0,648 |
0,531 |
0,469 |
0,458 |
0,542 |
0,456 |
0,144 |
0,066 |
4 |
0,681 |
0,319 |
0,419 |
0,581 |
0,586 |
0,414 |
0,434 |
0,334 |
0,145 |
5 |
0,352 |
0,648 |
1 |
0 |
0,271 |
0,729 |
0,456 |
1,208 |
0,551 |
6 |
0,374 |
0,626 |
0,529 |
0,471 |
0,456 |
0,544 |
0,468 |
0,146 |
0,068 |
7 |
0,517 |
0,483 |
0,489 |
0,511 |
0,477 |
0,523 |
0,499 |
0,024 |
0,012 |
8 |
0,637 |
0,363 |
0,552 |
0,448 |
0,364 |
0,636 |
0,462 |
0,376 |
0,173 |
9 |
0,659 |
0,341 |
0,433 |
0,567 |
0,581 |
0,419 |
0,449 |
0,296 |
0,133 |
Доход
да
хороший класс
плохой класс
Тридцать три записи, в которых доход <=10000 и по этой причине оказавшиеся в правом узле, содержат одну и ту же целевую переменную, указывающую на плохой класс заемщика. Т.о. узел является чистым. узел будет объявлен листом, и дальнейшее разбиение по данной ветви проводится не будет. Записи в левом узле относятся к различным классам. Потребуется дальнейшее их разбиение.
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
1 |
0,31 |
0,69 |
0,278 |
0,722 |
0,275 |
0,725 |
0,428 |
0,012 |
0,005 |
2 |
0,31 |
0,69 |
0,222 |
0,778 |
0,3 |
0,7 |
0,428 |
0,156 |
0,067 |
3 |
0,31 |
0,69 |
0,389 |
0,611 |
0,225 |
0,775 |
0,428 |
0,328 |
0,14 |
4 |
0,655 |
0,345 |
0,158 |
0,842 |
0,5 |
0,5 |
0,452 |
0,684 |
0,309 |
6 |
0,328 |
0,672 |
0,316 |
0,684 |
0,256 |
0,744 |
0,441 |
0,12 |
0,053 |
7 |
0,552 |
0,448 |
0,344 |
0,656 |
0,192 |
0,808 |
0,496 |
0,304 |
0,151 |
8 |
0,586 |
0,414 |
0,324 |
0,676 |
0,208 |
0,792 |
0,485 |
0,232 |
0,113 |
9 |
0,638 |
0,362 |
0,216 |
0,784 |
0,381 |
0,619 |
0,462 |
0,33 |
0,152 |
Доход <= 10000
нет
Иждивенцы<=1
плохой класс
нет
иждивенцы>1
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
1 |
0,33 |
0,67 |
1 |
0 |
0,75 |
0,25 |
0,442 |
0,5 |
0,221 |
2 |
0,167 |
0,833 |
1 |
0 |
0,8 |
0,2 |
0,278 |
0,4 |
0,111 |
3 |
0,33 |
0,67 |
1 |
0 |
0,75 |
0,25 |
0,442 |
0,5 |
0,221 |
6 |
0,25 |
0,75 |
1 |
0 |
0,778 |
0,222 |
0,375 |
0,444 |
0,167 |
7 |
0,67 |
0,33 |
0,75 |
0,25 |
1 |
0 |
0,442 |
0,5 |
0,221 |
8 |
0,75 |
0,25 |
0,889 |
0,111 |
0,67 |
0,33 |
0,375 |
0,222 |
0,083 |
9 |
0,67 |
0,33 |
0,75 |
0,25 |
1 |
0 |
0,442 |
0,5 |
0,221 |
Доход <= 10000
нет
Иждивенцы<=1 плохой класс
да
месячный платеж<= 5000
плохой класс заемщика
да
месячный платеж<=5000 плохой класс заемщика
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
1 |
0,375 |
0,625 |
1 |
0 |
0,6 |
0, 4 |
0,469 |
0,8 |
0,375 |
2 |
0,125 |
0,875 |
1 |
0 |
0,714 |
0,286 |
0,219 |
0,572 |
0,125 |
3 |
0,25 |
0,75 |
1 |
0 |
0,67 |
0,33 |
0,375 |
0,66 |
0,248 |
6 |
0,25 |
0,75 |
1 |
0 |
0,67 |
0,33 |
0,375 |
0,66 |
0,248 |
7 |
0,75 |
0,25 |
0,67 |
0,33 |
1 |
0 |
0,375 |
0,66 |
0,248 |
8 |
0,75 |
0,25 |
0,833 |
0,167 |
0,5 |
0,5 |
0,375 |
0,666 |
0,25 |
Доход <= 10000
нет
Иждивенцы<=1 плохой класс
да
месячный платеж<= 5125
плохой класс заемщика
да
плохой класс заемщика
возраст<=30
нет
плохой класс заемщика
возраст<=30
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
2 |
0,2 |
0,8 |
1 |
0 |
0,5 |
0,5 |
0,32 |
1 |
0,32 |
3 |
0,2 |
0,8 |
1 |
0 |
0,5 |
0,5 |
0,32 |
1 |
0,32 |
7 |
0,6 |
0,4 |
0,33 |
0,67 |
1 |
0 |
0,48 |
1,34 |
0,643 |
8 |
0,8 |
0,2 |
0,75 |
0,25 |
0 |
1 |
0,32 |
1,5 |
0,48 |
Доход <= 10000
нет
Иждивенцы<=1
да нет заемщика
месячный платеж<= 5000
плохой класс заемщика
да
плохой класс заемщика
возраст<=30 нет
да
плохой класс заемщика
срок прожив<=10 нет
да плохой класс заемщика
срок прожив<=10
№ |
PL |
PR |
P(j/tL) |
P(j/tR) |
2* PL* PR |
W(s/t) |
Q(s/t) | ||
плохой |
хороший |
плохой |
хороший | ||||||
2 |
0,33 |
0,67 |
1 |
0 |
0 |
1 |
0,442 |
2 |
0,884 |
8 |
0,67 |
0,33 |
0,4 |
0,6 |
0,5 |
0,5 |
0,442 |
1 |
0,442 |
Информация о работе Контрольная работа по "Интеллектуальной информационой системе"