Автор: Пользователь скрыл имя, 14 Ноября 2011 в 21:51, реферат
Статистика (stato - состояние ) - это совокупность данных наблюдений ,
статистическая совокупность - это, как правило, количественная оценка
исследуемого явления, собранная одномоментно из разных источников или в
одном месте в разное время (числовые значения).
Статистической совокупностью - называется генеральной совокупностью, если
включает в себя все возможные значения данного явления. Такую совокупность
практически трудно создать в силу бесконечного ее объема, поэтому чаще
всего статисты работают с некоторой частью генеральной совокупности,
которая называется - выборкой. Работая с выборкой должны получать
результаты, которые соответствуют генеральной совокупности.
повторяющихся значений либо мало, либо вообще повторений нет. Все
имеющиеся значения вариант совокупности встречаются только единожды.
Частоты равны единице. График теряет смысл. Поэтому для небольших по
объему
совокупностей Рациональнее
интервальному
вариационному ряду.
Но, как
уже говорили раньше, и для
больших по объему
построить
полигон по интервальному
Для этого по оси абсцисс откладываются значения середин интервала, -
среднеинтервальные значения совокупности, а по оси ординат, как всегда, -
частоты. Крайние ординаты соединяют с серединой интервалов, где частоты
равны нулю.
Гистограмма распределения строится только для совокупности, представленной
в виде
интервального вариационного
прямоугольных
системах координат.
В отличие от полигона, для гистограммы на оси абсцисс откладываются
отрезки,
соответствующие интервалу
основании
строится прямоугольник,
частоты,
соответствующей данному
Получим
как бы ступенчатую
что распределение
вариант внутри интервала
Можно представить себе, что при последовательном делении интервалов,
ступенчатая
гистограмма превратится в
название
кривой распределения.
Кумулята, кумулятивная кривая, выполняется в прямоугольной системе
координат. По оси абсцисс откладываются значения признака (варианты), а по
оси ординат
- соответствующие накопленные
пересечения
соединяются отрезками прямой.
Кумулятивную кривую можно построить как для дискретного вариационного
ряда, так
и для интервального.
Для интервального вариационного ряда по оси абсцисс откладываются
среднеинтервальные значения. Нижней границе первого интервала
соответствует частота равная нулю, а верхней границе последнего интервала
- Сумма
всех частот или общее
При выборе соотношения между масштабом и по осям абсцисс и ординат
целесообразно
использовать правило “
располагается в прямоугольнике, размеры которого пропорциональны 5 : 8 или
3 :4, а линии графика занимают всю площадь графика. Сравнение этих
графиков показывает, что переход к интервальным значениям значительно
сглаживает
график и выделяет сущность
совокупности.
Построим графики для совокупности, представленной в виде интервального
вариационного
ряда. Воспользуемся табл. 3 и 4.
Xi 1470 2006 2030
2073 2305 2444 2535 2625 2710 N
mi 1 1 1 1 1 1 1 1
1 9
Табл. 3
№№ X min X max
Xi m1 ni Mi
1 2 3 4 5 6
1 1300 1700 1500 1
0,111 1
2 1700 2100 1900 3
0,333 4
3 2100 2500 2300 2
0,222 6
4 2500 2900 2700 3
0,333 9
Табл. 4
Построим полигонную ломаную - “ полигон “, по оси абсцисс отложим значение
вариант
Xi , а по оси ординат - значение
частот этих вариант mi .
Из таблицы 4 следует, что наименьшее Xi=Xmin=1470, а наибольшее
Xi=Xmin=2710, поэтому на оси абсцисс отложим 1300 и 2900, т. е. значения
включающие min и max. И на полученном отрезке оси отметим точки,
соответствующие
значениям всех вариант
Как видим по таблице 3 наибольшее значение частоты mi=3. Поэтому ось
ординат достаточно разделить на 3 равные части (рис.1). А масштаб графика
выберем
так, чтобы выдержалось
Аналогично
построим и полигон для
интервального
вариационного ряда.
Используем таблицу 4 . По оси абсцисс графика откладываются значения
столбца 3 из таблицы 4 . Среднеинтервальные значения Xi варьируют в
пределах 1500 : 2700 . Эти значения и должны служить границами графика
(рис. 1). Наибольшая частота mmax=3. Поэтому достаточно ось координат
разделить
на 3 равных отрезка.
Нанесем точки на ось абсцисс: 1500, 1900, 2300, 2700. На оси ординат
отложим
1, 3, 2, 3.
На пересечении этих значений отметим точки полигона и соединим точки
отрезками прямой. Можно добавить в таблице 4 две строчки - в начале и в
конце таблицы:
1 2 3 4 5 6
0 < 1300 1100 0
5 > 2900 3100 0
Табл. 5
№№ X min X max
Xi m1 ni Mi
1 2 3 4 5 6
0 < 1300 1100 0
1 1300 1700 1500 1
0,111 1
2 1700 2100 1900 3
0,333 4
3 2100 2500 2300 2
0,222 6
4 2500 2900 2700 3
0,333 9
5 > 2900 3100 0
Табл. 4А
Эти дополнения
дают нам возможность
прямой
до пересечения с осью абсцисс.
Построим
гистограмму.
Для этого
используем интервальный
На оси
абсцисс отложим отрезки,
ряда. На
них, как на основании,
высотой,
пропорциональной частоте.
mi3
2
1
0 1300 1700 2100 2500
2900 Xmin : Xmax
Если представить, что интервалы последовательно и многократно делят на
два, тогда
столбики гистограммы
пределе
верхние отрезки столбиков
огибающая
линия. Эта линия и носит
название кривой распределения.
процесс
требует большого количества
наблюдений.
В последующих
результатах анализа
рассмотрения.
Построим кумуляту. Кумулятивная ломаная строится как для дискретного так и
для интервального
ряда.
Не усложняя
процесс анализа
только
для интервального
Отложим
по оси абсцисс значение
по оси ординат - накопленные частоты, И соединим точки пересечения
отрезками
прямой.
Можно сказать,
что основное количество
интервалах, т.к. угол между осью абсцисс и отрезком кумуляты в этих
интервалах больше, чем в серединном интервале. Ведь очевидно, что если бы
интервал имел частоту, равную нулю, то соответствующий отрезок
кумулятивной
ломаной был бы параллелен
оси абсцисс.
Так, если к нашей совокупности, соответственно интервальному ряду,
добавить
еще один интервал, то частота
его будет равна 0.
На кумуляте
можно определить значение Ме.
Как известно, медиана - это значение признака, находящегося посредине
совокупности. В данном случае всего девять значений, N=9, значит, N/2=4,5.
Откладываем это значение на оси ординат, проводим горизонтальную линию
(параллельную оси абсцисс) до пересечения с графиком кумуляты, из точки
пересечения опускаем перпендикуляр на ось абсцисс. Это значение и есть
значение
медианы - Меграф.
Выводы.
На полигонной
ломаной нельзя сделать
немного и они имеют большой разброс, что и сказалось на графике. Несколько
сглаженные
интервальные значения
достаточно
симметричного вида.
Кумулята
свидетельствует о том, что
в построении вариационного
пустых
интервалов, т.е. интервалов с
частотой равной нулю.
Таким образом,
можно считать, что данная
в дальнейшее
исследование.
1.4. Определение
средних значений
Общее положения.
Средняя
- обобщающая количественная
позволяет
одной величиной
В статистике
различают много видов средних.
определяется
видом признака и целями
В данной
работе будут рассмотрены
медиана
и мода. Среднюю арифметическую
называют параметрической
Средняя
арифметическая может быть
Дискретная
(или простая) средняя
Xa - обозначение
средней арифметической, дискретной
;
xi - отдельные
значения совокупности, ( i = 1,2, ... N );
N - количество
значений в совокупности.
Если наблюдений
в совокупности достаточно
повторяются.
Тогда, представленная
вариационного ряда, можно вычислить среднюю арифметическую с помощью
частот.
Частота выступает в виде веса данного значения совокупности, а общая
формула
примет вид, где
- средняя
арифметическая взвешенная;
xi - отдельное
значение совокупности;
N - вес (частота
) этого значения;