Автор: Пользователь скрыл имя, 16 Января 2011 в 19:02, контрольная работа
Решение 2 задач.
Коэффициент вариации позволяет сопоставить между собой статистические совокупности, у которых значения признака измеряются в разных единицах измерения. Так, например, можно сравнить, что на предприятии изменяется больше – величина заработной платы рабочих или производительность труда. Чем меньше коэффициент вариации, тем более однородной является изучаемая статистическая совокупность. Принято считать, что при коэффициенте вариации более 10 процентов изучаемая совокупность не является однородной и для ее достоверного описания необходимо по какому-либо признаку выделять группы, обладающие большей однородностью. Рассматривая, например, среднюю заработную плату рабочих цеха, рассчитывая коэффициент вариации заработной платы и получив его достаточно большим (много больше 10 процентов), можно попытаться выделить в изучаемой совокупности две группы рабочих: основные рабочие и вспомогательные. По каждой из этих групп определяется средняя заработная плата, вариация признаков в каждой группе меньше (меньше должны быть коэффициенты вариации), и полученные средние более достоверно будут характеризовать изучаемую совокупность статистических данных.
Еще одной из характеристик изучаемой совокупности является медиана Ме – число, делящее упорядоченную по возрастанию совокупность значений признака на две равные части, у одной части значение признака меньше медианы, у другой части – больше.
Пример: значения признака выражены числами 2, 2, 4, 5, 7, 9, 10. Медианой является число 5, три значения признака в этой совокупности меньше 5, три значения больше 5. В случае четного числа значений признака:
2, 2, 4, 5, 7, 9, 10, 11 медианой является число , делящее рассматриваемую совокупность на 2 части. При этом четыре значения признака меньше 6, четыре значения – больше.
В
РГР предлагается определить для
каждого объекта наблюдения медиану
возраста оборудования – возраст, который
превысила уже половина станочного парка.
Метод
группировок
Для выяснения закономерностей, существующих в изучаемой совокупности, и для установления возможной связи между различными признаками используют метод группировок. Группировка – процесс разделения статистической совокупности на группы, однородные в каком-либо отношении либо имеющие одинаковые или близкие значения группировочного признака. Так, например, всю совокупность станочного парка предприятия можно разбить на группы по признаку "возраст", образовав группы станков: от 1 до 5 лет, от 6 до 10, от 2 до 15 и от 16 до 20 лет. Здесь в качестве группировочного признака выбран возраст и созданы группы, имеющие близкое значение группировочного признака. Подсчитав число станков, попавших в каждую группу, можно сделать выводы о распределении станков по возрасту. По каждой выделенной группе далее можно рассчитать значения других признаков, характеризующих станки. Например – среднее по группе число часов простоев за год, средние по группе эксплуатационные расходы, общее число текущих ремонтов за период и др. Выполнив подобные расчеты, можно посмотреть, как с увеличением возраста станков от группы к группе меняется второй признак.
Группировки подобного рода, сопоставляющие два признака, называются аналитическими. Тот признак, который оказывает влияние на другой, называется факторным, а тот, на котором отражается воздействие факторного признака, называется результативным. Если при увеличении факторного признака результативный увеличивается, то говорят о наличии прямой связи между двумя изучаемыми признаками, если при увеличении факторного признака результативный уменьшается, то говорят об обратной связи. Однако проведение аналитической группировки позволяет лишь установить факт наличия связи, а степень тесноты связи, ее форму изучают более сложными методами, изложенными в следующем разделе.
Результаты выполнения группировки, показывающей структуру станочного парка по возрасту, удобно представить в следующем виде (табл. 6).
Таблица 6
Распределение
станочного парка
по возрасту
Группы по возрасту, лет | Число станков в группе, шт | В процентах к итогу |
от 1 до 5 | 5 | 14.29 |
от 6 до 10 | 16 | 45.71 |
от 2 до 15 | 10 | 28.57 |
от 16 до 20 | 4 | 11.43 |
Графический
способ представления этих же данных – гистограмма.
Гистограмма строится в прямоугольной
системе координат, где по оси абсцисс
откладываются отрезки, изображающие,
в каких пределах изменяются значения
изучаемого признака, а по оси ординат
на отложенных отрезках вплотную друг
к другу строятся прямоугольники, показывающие,
сколько значений признака при его группировке
попадают на тот или иной интервал. При
этом площади прямоугольников изображаются
пропорционально количеству значений
признака, попавшему на каждый из интервалов,
отложенных по оси абсцисс. В случае равной
величины интервалов, откладываемых по
оси X, высоты прямоугольников изображаются
пропорционально количеству значений
признака, попавших на каждый интервал.
Определение
моды
Мода
(
) – наиболее часто встречающееся значение
признака в совокупности.
где: ХМО – начало модального интервала; i – величина интервала; fMO –частота, соответствующая модальному интервалу; fMO–1 – предмодальная частота; fMO+1 – послемодальная частота.
Графически мода определяется по гистограмме распределения. Для этого правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.
Пример
построения гистограммы, основанный на
данных из табл. 6, и моды представлен на
рис.1.
Корреляция
Между
двумя статистическими
Рис. 1. Гистограмма
где v – скорость падения; t – время падения; g – ускорение свободного падения. По этому уравнению, зная время полета (факторный признак), всегда можно найти скорость падающего тела (результативный признак). Множество лабораторных экспериментов подтверждают записанное уравнение функциональной связи. Однако также хорошо известно, что лист дерева и камень падают с одной и той же высоты с разной скоростью. Парашютист приземляется на аэродроме всегда примерно с одинаковой скоростью, независимо от высоты, с которой произошел прыжок (значит, независимо и от продолжительности прыжка). В показанных примерах на падающее тело действует множество других факторов, главный из которых –сопротивление воздуха. В таких условиях, когда на связь между факторным и результативным признаком воздействует множество различных факторов, затруднительно установить функциональную связь между признаками. В подобных случаях изменение результативного признака У обусловлено влиянием факторного признака х лишь частично, однако это влияние вполне заметно. Это другой вид статистической связи – корреляционная связь.
Общая
форма корреляционной связи представляется
выражением:
где φ(х) – функция, представляющая форму связи между факторным и результативным признаками; ε – элемент, отражающий влияние всех неучтенных факторов.
При корреляционной связи между статистическими признаками одному и тому же значению факторного признака соответствуют различные значения результативного признака, однако есть и общая тенденция, показывающая, что в среднем при увеличении факторного признака происходит соответствующее увеличение или уменьшение, в среднем, результативного признака. Это среднее изменение и показывает функция φ(х).
Если рассматривать связь между возрастом оборудования и эксплуатационными расходами, связанными с этим оборудованием, то такую связь можно заметить, проведя аналитическую группировку (первая часть РГР): при увеличении возраста станков в среднем увеличиваются и эксплуатационные расходы. Однако по статистическим данным, представленным в табл. 2 – 5, видно, что в каждой таблице есть данные о станках с одинаковым возрастом, но со значительно различающимися эксплуатационными расходами, так как на величину этих расходов влияет не только возраст, но и ряд других факторов: частота и качество предыдущих технических обслуживаний, интенсивность эксплуатации станка, частота нарушений рекомендуемых режимов работы и др. Для одного типа станков определенному возрасту соответствует бόльшая вариация величины эксплуатационных расходов, другому типу станков – меньшая. Таким образом, для каждой из четырех групп станков, представленных таблицами, существует разная степень тесноты связи между возрастом и эксплуатационными расходами.
К простейшим показателям тесноты связи относят коэффициент корреляции знаков – коэффициент Фехнера. Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних.
Для
его расчета вычисляют средние
значения результативного и факторного
признаков, а затем проставляют
знаки отклонений для всех значений
взаимосвязи пар признаков.
где Кф – коэффициент Фехнера; na – число совпадений знаков отклонений индивидуальных величин от средней; nв – число несовпадений знаков отклонений.
Коэффициент
Фехнера может принимать
Степень
тесноты связи в статистике измеряют
с помощью специального показателя, называемого
коэффициентом корреляции:
где х – значения факторного признака; у – значения результативного признака; n – общее число наблюдений.
Предполагается что в формуле суммирование производится для всех значений признаков хi и уi, . Эти обозначения опущены для упрощения записи.
Представленный коэффициент корреляции предполагает, что между х и у существует связь, которая является прямолинейной. В случае, когда связь между признаками нелинейная, используются другие статистические показатели для описания тесноты связи, рассмотрение которых не входит в задачу настоящих методических указаний.
Значения коэффициента корреляции могут изменяться от –1 до 1. В случае R=1 между признаками существует полная функциональная связь, причем связь прямая – при увеличении х увеличивается и у. При R = –1 –связь функциональная и обратная (при увеличении х у уменьшается). В случае, когда R=0, между изучаемыми признаками отсутствует какая-либо связь. Однако при изучении статистической связи очень редко появляются предельные значения коэффициента корреляции, поэтому полученным промежуточным значениям коэффициента корреляции дается качественная оценка: при R > 0.7 – теснота связи между х и у считается высокой, при R > 0.9 – очень высокой. Чем ближе коэффициент корреляции к 1 или –1, тем более тесной является связь между статистическими признаками. Получив в РГР коэффициенты корреляции для всех четырех групп станков, можно установить, для какой группы наблюдается более тесная связь между возрастом станков и величиной эксплуатационных расходов.
Вторым этапом изучения статистической связи вслед за определением степени тесноты связи с помощью коэффициента корреляции идет этап установления формы связи или вида функции φ(х), объясняющей основную закономерность влияния факторного признака х на результативный признак у.
Под формой статистической связи понимают ту тенденцию, которая проявляется в изменении изучаемого результативного признака в связи с изменением факторного признака. Форму связи можно попытаться установить, построив в прямоугольной системе координат все множество пар значений признаков (хi, уi), . По оси абсцисс откладываются значения факторного признака х, по оси ординат – значения признака у. Такое графическое построение называется полем корреляции или диаграммой рассеяния, пример построения представлен на рис. 2. По характеру расположения точек на координатной плоскости можно судить о характере статистической связи. Если наблюдается тенденция равномерного возрастания или убывания значений признака, то связь называется прямолинейной. При тенденции неравномерного изменения значений зависимость носит название криволинейной.