Автор: Пользователь скрыл имя, 18 Декабря 2012 в 16:03, курсовая работа
Цель курсовой работы – провести статистическое изучение общего образования в Амурской области с 2000 по 2009 года.
При этом поставлены задачи:
1 изучить теоретические основы статистики образования;
2 выявить методы расчёта и анализа статистики образования;
3 рассчитать и проанализировать показатели динамики численности учащихся в общеобразовательных учреждениях за последние 10 лет;
4 спрогнозировать численность учащихся в общеобразовательных учреждениях в Амурской области с 2010 по 2014 года
5 провести группировку районов по численности учащихся в общих образовательных учреждениях по данным 2009 года.
6 произвести расчет и анализ средних величин, показателей вариации численности учащихся в общеобразовательных учреждениях в Амурской области по данным 2009 года.
Введение 4
1 Теоретические основы статистического изучения общего образования 6
1.1 Содержание и сущность образования 6
1.2 Статистические методы оценки уровня образования 8
2 Статистический анализ численности учащихся в общеобразовательных учреждениях в Амурской области за 2000-2009 годы 22
2.1 Анализ динамики численности учащихся в общеобразовательных учреждениях в Амурской области за 2001- 2009 годы 22
2.2 Анализ структуры учащихся в общеобразовательных учреждениях за 2000-2009 годы 27
2.3 Группировка городов и районов Амурской области по численности учащихся в общеобразовательных учреждениях 28
2.4 Расчет и анализ средней численности учащихся в общеобразовательных учреждениях, и показатели вариации 33
2.5 Корреляционно-регрессионный анализ взаимосвязи между числом общеобразовательных учреждений и численностью учащихся в общеобразовательных учреждениях 36
Заключение 43
Библиографический список 45
Приложение А основные показатели образования 46
Приложение Б численность учащихся общеобразовательных учреждений 47
Для моментального
ряда динамики с равными интервалами
средней уровень ряда будет исчисляться
по формуле средней
Средний
уровень моментального ряда динамики
с неравными интервалами
где - среднее уровни в интервале между датами;
– интервал времени
Средний абсолютный прирост представляет собой обобщенную характеристику индивидуальных абсолютных приростов ряда динамики. Для определения среднего абсолютного прироста сумма цепных абсолютных приростов делится на их число n:
Средний темп роста – обобщающая характеристика индивидуальных темпов роста ряда динамики. Для определения среднего темпа роста применяется формула:
где - индивидуальные (цепные) темпы роста (в коэффициентах), n – число индивидуальных темпов роста.
Средний темп прироста можно определить на основе взаимосвязи между темпами роста и прироста. При наличии данных о средних темпах роста для получения темпов прироста используется зависимость:3
Система уравнений для вычисления параметров уравнения прямой аналитического выравнивания:
. (13)
Уравнение аналитического выравнивания имеет вид прямой:
, (14)
где и – параметры уравнения;
- показатель времени.4
Обобщённой количественной характеристикой признака в статистической совокупности в конкретных условиях места и времени является средняя величина, которая определяется по формуле:
где - частота или численность отдельных вариант;
- варианта или отдельное значение варьируемого признака.
Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. Вычисляется по формуле:
где - нижняя граница модального интервала;
- величина модального интервала;
- частота модального интервала;
- частота интервала, предшествующего модальному;
- частота интервала, следующего за модальным.5
Медиана – вариант, расположенный в середине упорядоченного вариационного ряда, делящего его на 2 равные части. Рассчитывается по формуле:
где - нижняя граница медианного интервала;
- частота медианного интервала;
- величина медианного интервала;
-сумма накопленных частот ряда, предшествующего медианного интервала;
- сумма частот ряда.6
Колеблемость
отдельных значений характеризуют
показатели вариации. Под вариацией
в статистике понимают такие количественные
изменения величины исследуемого признака
в пределах однородной совокупности,
которые обусловлены
Для изменения степени колеблемости отдельных значений признака от средней исчисляют основные обобщающие показатели вариации: дисперсия, среднее квадратическое отклонение и коэффициент вариации.
На практике меру вариации более объективно отражает показатель дисперсии.
Дисперсия ( ) – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической.
Среднеквадратическое отклонение находится по формуле:
,
Для определения однородности и неоднородности совокупности применяется коэффициент вариации:
,
Если < 33, то совокупность однородная, в противном случае – неоднородная.
При проведении группировки муниципальных образований, которая представляет собой процесс образования однородных групп на основе разбиения статистической совокупности на части по существенным для них признакам, используют формулу нахождения количества групп в группировке:
где N- число муниципальных образований.
Для выявления шага (длины интервала) в группировке служит формула:
где - минимальное значение в группировке;
- максимальное значение в группировке.7
Корреляционный анализ имеет
своей задачей количественное определение
тесноты связи между двумя
признаками, либо между результативным
и множеством факторных признаков.
Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины обусловлено влиянием одной или нескольких независимых величин, а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения.
Вычисление параметров корреляционных линейных уравнений по первичным данным. Параметры уравнения прямой и определяются путем решения системы нормальных уравнений, полученных методом наименьших квадратов:
, (23)
где – индивидуальные значения результативного признака;
– индивидуальные значения факторного признака;
– число единиц наблюдения;
– параметры уравнения прямой (уравнения регрессии).
Параметр показывает усреднённое влияние на результативный признак неучтённых факторов, параметр показывает изменение результативного признака при изменении факторного признака на единицу.
Уравнение прямой (регрессии) имеет вид:
, (24)
где – теоретическое значение результативного признака.
Линейный коэффициент корреляции ( ) характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости и находится по итоговым значениям исходных переменных по формуле:
. (25)
По значению коэффициента корреляции судят о степени тесноты связи. Количественные критерии оценки тесноты связи представлены в таблице 1.8
Таблица 1 – Количественные критерии оценки тесноты связи
Величина коэффициента корреляции |
Характер связи |
1 |
2 |
до |
практически отсутствует |
|
слабая |
|
умеренная |
|
сильная |
Формула вычисления среднего квадратического отклонения результативного признака:
. (26)
Формула среднего квадратического отклонения факторного признака:
. (27)
Формула нахождения коэффициента вариации результативного признака:
. (28)
Формула вычисления коэффициента вариации факторного признака:
. (29)
Линейный коэффициент корреляции можно определить по формуле:
. (30)
Формула вычисления факторной дисперсии, характеризующей вариацию результативного признака под влиянием признака фактора, включённого в модель:
.9
Силу влияния факторного
признака на результативный можно измерить
с помощью коэффициента детерминации
и эмпирического
Коэффициент детерминации равен:
. (32)
Корень квадратный из коэффициента детерминации называется эмпирическим корреляционным отношением:
. (33)
По абсолютной величине коэффициента определяют связь результативного признака с факторным.
Формула нахождения остаточной дисперсии:
. (34)
Остаточная дисперсия характеризует вариацию результативного признака под влиянием прочих неучтённых факторов.
Формула вычисления индекса корреляционной связи:
. (35)
Проверка адекватности однофакторной
регрессионной модели и значимости
показателей тесноты
, (36)
где – число параметров модели;
– число единиц наблюдения.10
Эмпирическое значение критерия сравнивается с критическим значением при уровне значимости 0,01 или 0,05 и с числом степеней свободы (m-1), (n-m). Если , то уравнение регрессии признается значимым (адекватным).
Значимость коэффициентов
линейного уравнения регрессии
оценивается с помощью t-
, (37)
. (38)
Эмпирическое значение t-критерия сравнивается с критическим значением t-критерия распределения Стьюдента при уровне значимости 0,01 или 0,05 и с числом степеней свободы (n-2). Если , то параметр уравнения регрессии признается значимым (адекватным).
Аналогично проводится оценка коэффициента корреляции с помощью t-критерия Стьюдента:
. (39)
Формула нахождения ошибки аппроксимации:
. (40)
В конце анализа сравниваются найденные значения линейного коэффициента корреляции, индекса корреляционной связи и эмпирическое корреляционное отношение и дается общая оценка тесноты связи между факторами:
.11
Индексы – обобщающие показатели сравнения во времени и в пространстве не только однотипных явлений, но и совокупностей, состоящих из несоизмеримых элементов. Методики построения и расчета индексов как для временных, так и для пространственных сравнений одинаковы. Не различаются между собой и методы построения индексов различных явлений.
Изменения совокупностей, состоящих из элементов, непосредственно не сопоставимых изучают с помощью групповых или общих индексов (I).
Формула вычисления агрегатного индекса физического объема:
, (41)
где – индексируемая величина;
– соизмеритель, фиксируемый на уровне одного и того же периода.
Формула вычисления агрегатного индекса цен Пааше:
. (42)
Формула вычисления агрегатного индекса цен Ласпейреса: