Статистические методы

Автор: Пользователь скрыл имя, 20 Декабря 2012 в 22:50, курсовая работа

Краткое описание

Понятие «управление качеством» как наука возникло в конце 19-го сто-
летия, с переходом промышленного производства на принципы разделения труда. Принцип разделения труда потребовал решения проблемы взаимозаменяемости и точности производства. До этого при ремесленном способе производстве продукции обеспечение точности готового продукта производилось по образцам или методами подгонки сопрягаемых деталей и узлов. Учитывая значительные вариации параметров процесса, становилось ясно, что нужен критерий качества производства продукции, позволяющий ограничить отклонения размеров при массовом изготовлении деталей.

Файлы: 1 файл

Курсовая работа Стат Методы.docx

— 838.99 Кб (Скачать)

Медианой Me(x) случайной величины называется такое её значение, для которого

P(X < Me(X)) = P(X > Me(X)) = ½ [3].    (2.1.1)

т.е. одинаково вероятно, окажется ли случайная величина меньше или больше . Геометрически медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам. Это показано на рисунке 2.1.2.

 

Рисунок 2.1.2 - Медиана

Дисперсией случайной  величины называется число   (другие распространенные обозначения:  , равное

                                                                      (2.1.2)

если   - дискретная случайная величина, и

                                                                       (2.1.3)

если   - непрерывная случайная величина.

Дисперсия характеризует  средний квадрат отклонения случайной  величины от своего математического ожидания [2].

Математическим  ожиданием (средним значением, первым моментом) случайной величины дискретным распределением, задаваемым таблицей , где называется число

(2.1.4)


 

 


если данный ряд абсолютно сходится, т.е. если  . В противном случае говорят, что математическое ожидание не существует[4].

 Средняя арифметическая: , (2.1.5)

                    

 где xi – варианты дискретного ряда или середины интервалов.

Вариационный размах – разность между наибольшей и наименьшей вариантой:  

                                                                          (2.1.6)

                                       

Среднее квадратическое отклонение: .                      (2.1.7)                                        

Начальный момент k-го порядка: .                 (2.1.8)

.                                   

Центральный момент k-го порядка: .     (2.1.9)

                       

Асимметрия:   .                               (2.1.10)

                                                     

Эксцесс: .                            (2.1.11)

                                               

      2.2 Практическая часть

Проанализировать ряд  данных с помощью гистограммы  и рассчитать числовые характеристики закона распределения: начальные и  центральные моменты, мода, медиана, квартили, децили, перцентили, и др. Для нормального распределения  рассчитать вероятность выхода за пределы  с помощью таблиц и функции  Гаусса и Лапласа 2011г. ФАИТУ: РЯ.

 

 

 

 

 

 

 

 

Исходные данные :

              Таблица 2.2.1 – Исходные данные

 

 

                                                

 

Проранжируем исходные данные:

             Таблица 2.2.2

 

 

Пункт 1.

Проанализировать ряд  данных с помощью гистограммы. Для этого воспользуемся программой «STATISTICA».

Рисунок 2.2.1 – Гистограмма

По гистограмме видно, что малая часть учащихся набрали  от 40-50, что означает среднюю подготовку к экзамену. Наибольшее количество абитуриентов набрали от 60-70 баллов.

Пункт 2

Вычислить числовые характеристики закона распределения. Для этого  воспользуемся формулами, данными  в теоретической части.

Таблица 2.2.3

 
Таблица 2.2.4

                                Таблица 2.2.5

                                          Таблица 2.2.6

квартель 1-й

квартель верхний 3-й

60,25

180,75

(63 балла)

(76 балла)


 

                                         Таблица 2.2.7

перцентиль(10)

перцентиль (90)

60

84


 

                                                       

Таблица 2.2.8

                            Таблица 2.2.9

 

Пункт 3. Функции Гаусса и  Лапласа.

 

 
Рисунок 2.2.2 – функция Гаусса

 
Рисунок 2.2.3 – функция Лапласа

Коэффициент вариации высок (<54%). Эксцесс положительный, т.е. полигон вариационного ряда имеет более крутую вершину по  сравнению с нормальной кривой. Значение коэффициента ассиметрии положительное, это говорит о правосторонней ассиметрии.

 

2.3 Библтография

 

  1. Теория вероятностей и математическая статистика.  Кремер Н.Ш. 2-е изд., перераб. и доп. - М.: Юнити-Дана, 2004.
  2. Теория вероятностей. Математическая статистика.  Бочаров П.П., Печинкин А.В. 2-е изд. - М.: Физматлит, 2005.

 

 

3 Корреляционный  анализ

    1. Теоретическая часть

 

Корреляционный анализ есть метод установления связи и измерения  ее тесноты между наблюдениями, которые  можно считать случайными и выбранными из совокупности, распределенной по многомерному нормальному закону.

Корреляционной связью называется такая статистическая связь, при  которой различным значениям  одной переменной соответствуют  разные средние значения другой. Возникать  корреляционная связь может несколькими  путями. Важнейший из них - причинная  зависимость вариации результативного  признака от изменения факторного. Кроме того, такой вид связи  может наблюдаться между двумя  следствиями одной причины. Основной особенностью корреляционного анализа  следует признать то, что он устанавливает  лишь факт наличия связи и степень  ее тесноты, не вскрывая ее причин.

В статистике теснота связи  может определяться с помощью  различных коэффициентов (Фехнера, Пирсона, коэффициента ассоциации и т.д.), а в анализе хозяйственной деятельности чаще используется линейный коэффициент корреляции [7].

Коэффициент корреляции между  факторами x и у определяется следующим образом:

Таким же образом вычисляется  коэффициент корреляции между факторами  в двухфакторной регрессионной  модели вида у = ах + b, a также при любой другой форме связи между двумя показателями.

Значения коэффициента корреляции изменяются в интервале [-1; + 1]. Значение r = -1 свидетельствует о наличии  жестко детерминированной обратно  пропорциональной связи между факторами, r = +1 соответствует жестко детерминированной  связи с прямо пропорциональной зависимостью факторов. Если линейной связи между факторами не наблюдается, r 0. Другие значения коэффициента корреляции свидетельствуют о наличии стохастической связи, причем, чем ближе |r| к единице, тем связь теснее[5]. 
           Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными. В первом случае предполагается, что мы можем определить только наличие или отсутствие связи, а во втором — также и ее направление. Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой. При этом коэффициент корреляции будет отрицательным. Положительная корреляция в таких условиях — это такая связь, при которой увеличение одной переменной связано с увеличением другой переменной. Возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин.

Метод вычисления коэффициента корреляции зависит от вида шкалы, к  которой относятся переменные: 

  • Переменные с интервальной и с номинальной шкалой: коэффициент корреляции Пирсона (корреляция моментов произведений). 
  • По меньшей мере, одна из двух переменных имеет порядковую шкалу либо не является нормально распределённой: ранговая корреляция по Спирмену или т (тау) Кендала. 
  • Одна из двух переменных является дихотомической: точечная двухрядная корреляция. Эта возможность в SPSS отсутствует. Вместо этого может быть применён расчёт ранговой корреляции. 
  • Обе переменные являются дихотомическими: четырёхполевая корреляция. Данный вид корреляции рассчитываются в SPSS на основании определения мер расстояния и мер сходства.

Линейный коэффициент  корреляции (или коэффициент корреляции Пирсона) [7]:

  (3.1.1)

 

3.2 Практическая часть

Провести корреляционный анализ данных по варианту Русский язык и математика №№101-300 (ФАИТУ).

 Исходные данные:

                  Таблица 3.2.1 – Исходные данные

 
            

 

Первый способ

Медиана для данных Х (№  101-300, русский язык): МЕ=79;

Медиана для данных У (№ 101-300, математика): МЕ=68.

 

 

Рисунок 3.2.1 -  Диаграмма рассеивания

n(+)=4;

n(-)=15;

K=n(+) + n(-)=-9;

α=0,05;

4 < 15, следовательно, присутствует обратная корреляция.

 

 

 

Вычислим коэффициент  корреляции:

r = S(xy)/ ;

S(xx) = ;

S(yy) = ;

S(xy) = ;

= 77,9;

= 69,3;

S(xx) = 2072,7

S(yy) = 678,3

S(xy) = -283,1

r = -283,1/  = - 0,24

Так как r = -0,24, то существует некоторая обратная корреляция.

 

 

 

Второй способ

Средняя линия русский язык - 78

Средняя линия математика -69

Рисунок 3.2.2 -  График значений по математике

Рисунок 3.2.3 -  График значений по русскому языку

 

n(+)=13 + 3/2=14.5      n(-)=17+3/2=18.5

 

k=7.5+9.5=33   

Коэффициент корреляции  мал. Следовательно, выборочные случайные величины слабо зависят друг от друга, значит исход величины X практически не влияет на исход величины Y.

 

 

    1.  Библиография
  1. В.В. Ковалев, О.Н. Волкова. Анализ хозяйственной деятельности предприятия «Корреляционный анализ» 1999г.
  2. Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 10-е издание, стереотипное. — Москва: Высшая школа, 2004.
  3. Суслов В.И., Ибрагимов Н.М., Талышева Л.П., Цыплаков А.А. Эконометрия. — Новосибирск: СО РАН, 2005.

 

 

4 Оперативные характеристики

4.1 Теоретическая  часть

 Оперативная характеристика  показывает вероятность принятия  партии в зависимости от действительной  доли дефектных единиц продукции  этой партии.

Оперативную характеристику следует учитывать при выборе плана контроля, особенно в случае, когда важным является риск потребителя  и поставщика во время отдельных  приемок[8].

Под планом статистического  контроля будем понимать   систему правил, указывающих методы отбора изделий для проверки, и условия, при которых партию следует  принять, забраковать или продолжить контроль. Различают следующие  виды планов статистического контроля партии продукции по альтернативному признаку: одноступенчатые, двухступенчатые, многоступенчатые и последовательный контроль.

Одноступенчатые планы,  согласно которым если  среди n случайно отобранных изделий число дефектных m окажется не  больше приемочного числа с (m ≤ c), то партия принимается; в противном случае партия бракуется.

Двухступенчатые планы,  согласно которым, если среди  n1  случайно отобранных  изделий  число дефектных m1 окажется не больше приемочного  числа с1 (m ≤ c1), то партия принимается; если m1 ≥ d1, где d1 -  браковочное число, то партия бракуется. Если  же с1 < m1 < d1, то принимается решение о взятии второй выборки объемом n2. Тогда если суммарное число дефектных изделий в двух выборках (m1 + m2) ≤ c2, то партия принимается, в противном случае партия бракуется по данным двух выборок.

Многоступенчатые планы  являются логическим продолжением двухступенчатых планов. Первоначально  берется выборка объемом n1 и определяется число    дефектных изделий m1.  Если m1  ≤  c1,  то  партия принимается. Если m1 ≥ d1 (d1 > c1 + 1), то партия бракуется. Если  же с1 < m1 < d1, то принимается решение о взятии второй выборки  объемом n2.  Пусть среди n1 + n2   изделий имеется m2 дефектных. Тогда  если m2 ≤ c2, где с2 – второе приемочное число, то партия принимается; если m2 ≥ d2 (d2 > c2 + 1), то партия бракуется. При с2 < m2 < d2  принимается решение   о взятии третьей выборки. В дальнейшем контроль проводится по аналогичной схеме, за исключением последнего k – го шага, при котором если mk ≤ ck, то партия принимается, если же mk > ck, то партия бракуется. При этом обычно принимается, что объем выборок одинаков.

Информация о работе Статистические методы