Анализ количественных данных: понятие, цели, последовательность этапов

Автор: Пользователь скрыл имя, 22 Апреля 2015 в 17:52, курсовая работа

Краткое описание

Целью работы является изучение понятия, целей, последовательности этапов анализа количественных данных.
Достижение данной цели определило постановку и решение следующих задач:
- дать определение понятию «анализ данных»;
- изучить виды социологических данных;
- изучить структуру данных и стратегии анализа;
-определить последовательность этапов и цели анализа количественных данных;

Оглавление

Введение………………………………………………………………………..
Часть 1. Анализ количественных данных. Общая характеристика………...
1.1. Понятие «Анализ данных». Виды социологических данных…………..
1.2. Структура данных и стратегии анализа…………………………………
Часть 2. Последовательность этапов и цели анализа количественных данных………………………………………………………………………….
2.1. Связь анализа данных с другими этапами исследования. Основные цели анализа данных…………………………………………………………..
2.2. Основные этапы анализа данных………………………………………...
Заключение……………………………………………………………………..
Список использованной литературы………………........................................

Файлы: 1 файл

реферат анализ кол данных.doc

— 117.50 Кб (Скачать)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Часть 2. Последовательность этапов и цели анализа количественных данных.

2.1. Связь анализа данных с другими этапами исследования. Основные цели анализа данных.

 

Использование математических методов предполагает определенную формализацию реальности, построение ее модели. Поскольку данные предстают перед социологом в виде фактов, характер которых объясняется влиянием искомых закономерностей, элементами модели являются как объекты, так и закономерности, которые как бы являются "причинами" того, что факты имеют заданный вид. Построение такой модели предполагает выделение нескольких этапов, при этом корректность использования математического аппарата на любом из них тесно связана с принципами реализации других этапов, в том числе и таких, в которых не задействованы никакие математические методы.

Таким образом, моделирование реальности, включающее формирование представлений об объекте и предмете исследования, выделение и операционализация основных понятий, измерение объектов, реализация конкретного алгоритма анализа данных и интерпретация полученных результатов предстает в виде цельного процесса, каждый из этапов которого тесно связан и взаимообусловлен с остальными.

На определенном этапе моделирования реальности в исходных данных условно выделяют два аспекта:

● содержательный уровень (совокупность реальных объектов, т.е. то, что в теории измерения называют эмпирической системой с отношениями);

● формальный уровень (совокупность математических конструктов, отражающих в результате измерения реальные объекты и отношения между ними - т.е. числовая система с отношениями).

Статистические методы анализа используют именно формальные данные, при этом они предстают в виде совокупности значений каких либо признаков (характеристик, переменных, величин и т.п.), измеренных для каждого из изучаемых объектов.

Каждый изучаемый объект рассматривается исследователем как последовательность чисел - значений для него некоторых признаков. Такие данные предстают в виде матрицы "объект - признак".

В соответствии с представлениями исследователя, связи между признаками, отображенными в матрице, объясняются определенными закономерностями.

Закономерность возникает как результат взаимодействия большого числа элементов, составляющих совокупность, и характеризует не столько поведение отдельного элемента совокупности, сколько совокупность в целом.

Любая выявленная в процессе научного исследования закономерность является определенного рода "сжатием" какой-то информации (в нашем случае - матрицы "объект- признак"). Результаты такого сжатия чаще всего выражаются в виде определенных характеристик частотных распределений значений рассматриваемых признаков. Можно сказать также, что результат сжатия - некоторые числа, которые характеризуют данные в целом.

Таким образом, выявление (подтверждение, корректировка) неких интересующих социолога статистических закономерностей, или, другими словами, - определенного рода сжатие, усреднение содержащихся в данных информации является основной целью анализа социологической информации. По выражению Дж. Тьюки, целью анализа данных является "охват" содержания исходных данных значительного объема, который позволяет прийти к представлениям, легко доступным для понимания пользователя.

Помимо этого в качестве целей анализа данных выделяют:

● объяснение интересующего социолога явления

● описание исходных данных

● предсказание того или иного явления

Задача объяснения, которое понимается здесь как подведение явления под какой-либо закон, является актуальной для любого исследования. Объясняемым явлением может быть как сама совокупность наблюдаемых фактов (формальные данные), так и содержательные закономерности, определяющие характер исходных данных. В первом случае искомым законом будет коэффициент связи между определенными признаками (например, между образовательным уровнем и доходами), а во втором - некие содержательные представления о причинах, связывающих исходные данные (например, высокий образовательный статус подразумевает получение ответственной должности, которая оплачивается сравнительно более высоко).

Описание - начальный этап анализа, который служит для элементарного упорядочивания данных. Достигается оно обычно при помощи самых простых алгоритмов сжатия исходной информации. Совокупность наиболее употребительных приемов получения закономерностей, описывающих изучаемое множество объектов называют описательной или дескриптивной статистикой.

Наиболее популярный (хотя и зачастую ошибочный) способ описания имеющихся количественных данных заключается в определении следующих показателей6:

количество наблюдений в выборке или ее объем;

средняя величина(среднее арифметическое);

стандартное отклонение- показатель того, насколько широко изменяются значения переменных.

Важно помнить, что среднее арифметическое и стандартное отклонение - это меры центральной тенденции и разброса в достаточно небольшом числе выборок. В таких выборках значения у большинства объектов с равной вероятностью отклонены от среднего, а их распределение образует симметричный «колокол» (гауссиану или кривую Гаусса-Лапласа). Такое распределение еще называют «нормальным», но в практике медицинского эксперимента оно встречается лишь в 30% случаев. Если же значения переменной распределены несимметрично относительно центра, то группы лучше описывать с помощью медианы и квантилей (процентилей, квартилей, децилей).

Прогноз тех или иных социальных характеристик или явлений служит целью выявления любой закономерности, поскольку изучать ту или иную сторону жизни общества нужно прежде всего для того, чтобы управлять какими-то процессами. Прогноз обычно осуществляется при помощи довольно сложных алгоритмов, например, регрессионного анализа.

 

2.2. Основные этапы анализа данных

 

Если рассматривать анализ данных как наиболее полную, завершенную и последовательную совокупность действий, не принимая во внимание того, что анализ данных может быть сокращенным, то можно выделить следующие основные этапы7.

1. Анализ данных начинается с  описания всей совокупности данных  в первоначальной, простейшей форме. Предваряется эта стадия контролем  информации и выбраковкой непригодных  данных: выявляются ошибки и пропуски, отсеиваются некомпетентные и недобросовестные респонденты, короче – производится «чистка массива». Далее производится собственно описание с использованием аппарата дескриптивной статистики. Изучаются простые распределения, выявляются аномалии, рассчитываются меры средней тенденции, вариации (разброс) распределения (дисперсия, среднее абсолютное и среднее квадратическое отклонения). Все эти шаги необходимы для решения двух задач:

а) общей оценки выборочной совокупности и отдельных подвыборок, с тем чтобы понять, каким образом особенности выборок будут сказываться на интерпретации того или иного вывода и обобщающих заключений;

б) для того чтобы не утратить представления о более сложных зависимостях и комбинациях, с которыми придется иметь дело впоследствии.

2. На втором этапе следует «уплотнение» исходной информации, т. е. укрупнение шкал, эмпирическая типологизация, формирование признаков-индексов и т. д. Главная цель всех этих операций – сокращение числа признаков, необходимых для итогового анализа. Вместе с тем достигается первичное обобщение данных, нужное для более глубокого анализа. Здесь же начинается переход к анализу взаимосвязей, который полностью развернется на третьем этапе. Начинают использоваться так называемые «сильные» операции: типологический анализ, факторный анализ и т. п. Как следствие, формируются интерпретационные схемы, по сути – «каркасы» понимания эмпирического материала.

3. Данная стадия непосредственно  вытекает из предыдущей. Происходит  углубление интерпретации и переход  к объяснению фактов путем  выявления прямых и косвенных детерминаций внутри массива. Здесь должны быть получены основные выводы, необходимые для подтверждения (опровержения) гипотезы, теоретического осмысления проблемы и выработке типологических рекомендаций. Основная опасность здесь – подмена косвенных, опосредованных связей прямыми. Это, кстати, одна из самых распространенных ошибок при анализе данных.

4. На заключительном этапе аналитическое  исследование непосредственно переходит  в прогностическую и рекомендательную  процедуру действий. Для этого полезно прибегнуть к проверке основных выводов исследования. Идеальным вариантом является повторное исследование. За его невозможностью, целесообразно использовать мысленный эксперимент, регрессионный и детерминационный анализы, экспертный опрос.

Необходимо постоянно помнить: в конечном счете, единственное, что обеспечивает теоретическую убедительность и практическую значимость исследования – это интерпретационная модель («модель объяснения»). В свою очередь, основы интерпретации заложены в социологическом мировоззрении исследователя, его жизненном и профессиональном опыте и, наконец, в исследовательской программе, гипотезах. Построение интерпретационных моделей – сугубо творческая, неформализуемая и даже полностью нерационализируемая операция. Решающее значение здесь приобретают общемировоззренческий и общетеоретический кругозор, перспективность и широта мышления, профессиональные знания и опыт, интуиция, воображение, личностные качества и коммуникативный талант. То, что было сказано о четырех этапах анализа данных, можно представить в виде компактной таблицы (табл. 4)8.

Таблица 4

Последовательность стадий анализа данных

Стадии анализа данных

Исследовательские задачи данной стадии анализа

Основные процедуры анализа

1

Выявление аномалий, ошибок и пропусков в исходных данных, коррекция выборки, выбраковка непригодного материала, описание простых распределений

Качественный анализ сгруппированных данных: использование приемов описательной (дескриптивной) статистики; расчеты средних тенденций, вариаций (разброса) ассиметрии

2-3

Уплотнение исходной информации и ее описание в зарегистрированных показателях, с тем чтобы избавиться от излишней детализации, избежать ошибок последующего анализа вследствие «провалов» в исходных распределениях, повысить уровень обобщения.

Приемы укрупнения исходных шкал, логические комбинации частных признаков, построение индексов, эмпирическая и теоретическая типологизация, факторный анализ

2-3

Выявление прямых и косвенных связей, интерпретация и объяснение основных зависимостей и свойств изучаемых явлений, проверка главных и второстепенных гипотез

Построение двухмерных и многомерных таблиц; расчет корреляций, регрессий, энтропии и ассоциации распределений; использование корреляционных графов детерминационных моделей

4

Прогноз изучаемых процессов и явлений на основе объяснительных гипотез

Приемы мысленного и, если возможно, натурального экспериментирования, повторные и сравнительные исследования, контрольные опросы экспертов для проверки итоговых выводов, моделирование динамических процессов


 

В процессе анализа данных необходимо строго придерживаться гипотез, сформулированных в программе, избегая при этом двух крайностей: во-первых, поспешных заключений относительно их подтверждения (если факты «укладываются» в гипотезу) и, во-вторых, соблазна увлечься самим процессом анализа, что случается довольно часто и уводит в сторону от целей исследования. Чем дальше мы углубляемся в анализ данных, тем большее значение приобретают объяснительные гипотезы, непосредственно связанные с программными задачами исследования. Если гипотезы нестандартны и нетривиальны, особое внимание следует уделить заключениям, которые с ними не согласуются. В результате проверок и перепроверок вводятся ограничения и уточнения исходных гипотез, и обнаруживается либо справедливость выдвинутых предположений, либо опровержение. Не следует смешивать уточнение и интерпретацию данных с их объяснением, ибо они суть различные по своей сущности этапы анализа. Объяснение является главной задачей анализа: оно позволяет установить причинные зависимости, истолковать найденные связи в понятиях более общих тенденций и закономерностей, дает основание для прогноза и, следовательно, для перехода к обоснованию практических решений изучаемых социальных проблем.

 Всегда нужно помнить о взаимодополнительности качественных и количественных методов. Количественный анализ в совокупности с качественной интерпретацией и пониманием массовой статистики всегда более ценен, нежели всесторонняя интерпретация одних лишь статистических данных. – Ибо без качественной интерпретации эти данные всегда будут оставаться непредставительными, т. е. нерепрезентативными. Применяя только качественный анализ, мы приобретаем определенное знание ограниченных фрагментов социальной реальности. – Используя только статистический анализ, мы выявляем факты и явления без их смысла и гарантии их типичности и распространенности в широком социальном пространстве. Отсюда ясно, что мы должны комбинировать использование качественных и количественных стратегий. Только их совокупность позволит достичь конечных целей социологического исследования.

 

 

Заключение

 

 Итак, понятие анализа данных  означает совокупность действий, осуществляемые исследователем в процессе изучения неких данных с целью формирования определенного представления о характере описываемого явления. Предметом является техника формирования определенного представления. Основная цель анализа данных - выявление (подтверждение, корректировка) каких-то интересующих исследователя статистических закономерностей; или, другими словами, - определенного рода сжатие, усреднение содержащейся в данных информации.

Информация о работе Анализ количественных данных: понятие, цели, последовательность этапов