Автор: Пользователь скрыл имя, 20 Февраля 2012 в 16:46, контрольная работа
1.Подготовка эмпирических данных к обработке
МИНОБР НАУКИ РОССИИ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
| ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ |
КОНТРОЛЬНАЯ РАБОТА №
по дисциплине Социология
на тему Методы анализа эмпирических данных
Студент Лоренц Наталья Альбертовна
Факультет Финансово-кредитный
Курс 1 группа 112
зач. книжка № 11ФЛД11688
Преподаватель Никанорова Татьяна Васильевна
Челябинск – 2011
1.Подготовка эмпирических данных к обработке
Эмпирические данные - сведения, полученные на основе опыта, практики
Обработка данных подразделяется на несколько стадий:
редактирование информации- контролируется качества заполнения инструментария, исправление ошибок некачественно заполненных анкет, карточек и т.д.
кодирование- осуществляются числовые операции с информацией, введенной в память электронной машины. Если во время кодировки произойдет сбой, замена или потеря кода, то информация окажется не правильной.
статистический анализ — выявление некоторых статистических закономерностей и зависимостей, которые дают социологу возможность сделать определенные обобщения и выводы;
интерпретация — превращение социологических данных в показатели, которые являются не просто числовыми величинами, а определенными социологическими данными, соотнесенными с целями и задачами исследователя, его знанием, опытом.
В зависимости какое исследование проводится — качественное или количественное -различают анализ информационного материала.
В качественном исследовании анализ обычно начинается уже на этапе сбора данных, поскольку ученый делает комментарии в своих полевых записях, отмечает обсуждаемые идеи и т.д. В период анализа исследователю иногда приходится вновь возвращаться к сбору данных, если их оказалось недостаточно или чтобы проверить правильность выдвинутых гипотез. В качественном анализе перед исследователем стоят проблемы соблюдения баланса между описанием и истолкованием (важно дать как можно более полное, максимально приближенное к действительности представление о наблюдаемом явлении, но избежать излишних комментариев), правильного соотношения между его интерпретациями и тем, как ситуацию воспринимают и понимают ее участники (важно максимально полно способствовать передаче восприятия действительности самими действующими лицами и избегать оправданий или диагностирования их поведения, чисто воспроизвести мнения действующих лиц, но и не менее важно сохранить те стороны изучаемого явления, которые подлежат лишь аналитической конструкции).
В количественном анализе оперируют понятиями переменных, влияющих друг на друга. При сборе, обработке, анализе, моделировании и сопоставлении результатов разных исследований используется совокупность методов и моделей прикладной математической статистики. К первой группе относят выборочный метод, описательную статистику, анализ связей и зависимостей, теорию статистических выводов, оценок и критериев, планирование экспериментов, ко второй — ряд методов многопеременной статистики, различные методы шкалирования, таксономические процедуры, корреляционный, факторный, причинный анализ, а также большую группу статистических моделей.
Анализ получаемых в ходе социологического исследования данных начинается с контроля за качеством заполнения инструментария, исправления ошибок и отбраковки (выбраковки) некачественно заполненных анкет, бланков, карточек и т.п. Категории качества заполнения инструментария разнообразны, подходы здесь неоднозначны. Все зависит от условий работы анкетеров, интервьюеров, места опроса и других факторов. Как правило, исследователи всегда стараются «довести» инструментарий до нужного качественного уровня.
Вначале выявляется правильность ответа на каждый вопрос и при необходимости ответ исправляется. Например, на вопрос: «Знаете ли вы основные условия, заложенные в трудовом соглашении вашего коллектива с администрацией предприятия?» чаще всего отвечают: «Да, знаю». Но далее в анкете стоит открытый контрольный вопрос: «Если знаете, назовите их, пожалуйста». Он остается незаполненным. Если с респондентом работал интервьюер, анкетер, то против этого вопроса должна стоять отметка: «Затруднился ответить», «Не знает» и т.п. Тогда становится очевидным, что респондент не осведомлен об условиях трудового соглашения. Но если респондент заполнял анкету самостоятельно, то здесь получение однозначного ответа затруднительно. В этом случае альтернативу «Да, знаю» надо зачеркнуть и отметить другую, скорее всего «Нет ответа», «Затрудняется ответить» и т.п. Затем подсчитываются неправильные ответы. При исправлении каждого третьего ответа в анкете ее лучше не готовить к машинной обработке. В случае если респондент не ответил на 10—15% основных вопросов, против них контролер ставит отметку «Нет ответа», и анкета идет на обработку в ЭВМ.
Более жесткие требования предъявляются к вопросам, касающимся социально-демографических характеристик респондентов (пол, возраст, образование и т.д.). Если нет ответов на эти вопросы, то инструментарий изымается из общего массива. Исключаются из обработки на ЭВМ документы, заполненные неразборчиво, а также записи, которые не поддаются однозначному толкованию.
Допущенные к обработке документы нумеруются, начиная с № 1 в целях контроля за их прохождением. В дальнейшем массив документов передается на кодирование. Но перед тем как передать анкеты в руки операторов, надо закодировать открытые вопросы. На каждый открытый вопрос, как правило, составляют не менее пяти шифров-кодов. Выше уже приводился один из открытых вопросов: «Если знаете, назовите, пожалуйста». Ответы на этот вопрос могут быть самыми разнообразными: от полных, глубоких, обстоятельных до ответов-схем. Шифры-коды должны отражать шкалу интенсивности ответов на открытый вопрос. Обычно кодирование таких ответов проходит в два-три этапа. Сначала варианты ответов выписывают отдельно, подсчитывают число употреблений каждого варианта — частота его повторения. Затем варианты группируются по смысловой близости, совпадению. Таких групп, как показывает практика, набирается четыре-пять, и каждой из них присваивается свой шифр или код.
Кодирование — связующее звено между качественной и количественной информацией. На данной основе и осуществляются числовые операции с информацией, введенной в память ЭВМ. Если во время кодирования произойдет сбой, замена или потеря кода, то информация окажется неправильной.
Сущность обработки первичной информации заключается в ее обобщении. Результаты обобщения называют социологической информацией. Решение о способе обработки инструментария принимается заранее. При опросе 60-70 человек обработку вполне можно провести вручную, на микрокалькуляторе. Если анкета сравнительно невелика (содержит до 20 вопросов), то ручная обработка возможна при наличии 200-350 анкет. Но если в инструментарии более 20 вопросов, тогда предел для ручной обработки – 100-200 анкет. При обработке на компьютере результаты отражаются в виде табуляграмм, структура которых зависит от заложенной в компьютере программы, поэтому здесь нужна помощь программиста.
2. Сущность и виды группировок. Таблицы и графики: их роль в анализе социологических данных.
Существуют качественные и количественные виды анализа массовой информации.
К качественным видам относятся:
• функциональный анализ, направленный на выявление устойчивых инвариантных связей объекта;
•структурный анализ, связанный с выявлением внутренних элементов объектов и способа их сочетания;
• системный анализ, представляющий собой целостное изучение объекта.
Количественный (статистический) анализ информации включает совокупность статистических методов обработки, сравнения, классификации, моделирования и оценки данных, полученных в результате социологического исследования.
По характеру решаемых задач и используемого математического аппарата методы статистического анализа подразделяются на четыре основные группы:
1) одномерный статистический анализ — дает возможность анализировать эмпирическое распределение измеренных в социологическом исследовании признаков. В этом случае вычленяются дисперсии и средние арифметические значения признаков, определяются частоты встречаемости различных градаций признаков;
2) анализ сопряженности и корреляции признаков — предполагает использование совокупности статистических методов, связанных с вычислением парных корреляций между признаками, измеренных в количественных шкалах, и анализ таблиц сопряженности для качественных признаков;
3) проверка статистических гипотез — позволяет подтвердить или опровергнуть определенную статистическую гипотезу, обычно связанную с содержательным выводом исследования;
4) многомерный статистический анализ — позволяет анализировать количественные зависимости отдельных содержательных сторон исследуемого объекта от множества его признаков.
Наиболее простой формой обобщения первичной информации является группировка. На этом этапе выделяются существенные признаки или один какой-либо признак (например, пол, возраст, образование), и респондент зачисляется в ту или иную группу в соответствии с выбранным признаком. Когда суммируются ответы респондентов с учетом, например, пола, то осуществляется простая группировка. Точно такую же работу можно проделать, взяв в качестве важнейшего признака уровень образования. Но в данном случае групп будет не две, а как минимум три или четыре.
Выделенные группы можно легко сопоставить, сравнить, а, следовательно, глубже и обстоятельнее проанализировать то или иное социальное явление, мотивы, интересы опрашиваемых. Выбор признака группировки предопределяется задачами социологического исследования, а также его гипотезами. Ошибка в выборе признака группировки приводит к ошибкам при анализе характеристик групп. Используя один и тот же эмпирический материал, разные исследователи могут сделать диаметрально противоположные выводы.
Социологическая информация может быть сгруппирована по:
• номинальному признаку (род занятий, национальность и т.д.);
• признакам, соответствующим ранговым шкалам (например, по характеру труда: ручной труд, работа с механизмами, наладка станков, интеллектуальный труд);
• количественному признаку (группы характеризуются числовым значением, они качественно сравнимы между собой, например группировка по возрастным интервалам: 18—20 лет, 21—25 лет, 26—30 лет и т.д.). Работа с номинальными и ранжированными группами ведется с использованием приемов математики, а группы, распределенные по количественному признаку, изучаются с помощью математической статистики.
Если опрашиваемых необходимо сгруппировать по двум или более признакам (например, по полу, возрасту и образованию), тогда речь может идти о перекрестной, или комбинированной, группировке. Она может быть структурной, типологической, аналитической — все зависит от решаемых в ходе исследования задач. Например, надо установить возрастной состав опрашиваемых. В этом случае применяется структурная группировка по возрастным интервалам, т.е. респондентов классифицируют по объективному признаку, присущему всей совокупности опрашиваемых. Если же необходимо выделить из респондентов группы по такому, например, признаку, как отношение к частной собственности, тогда осуществляется типологическая группировка (выделяются соответствующие типы респондентов). И, наконец, аналитическая группировка производится по двум и более признакам и служит для выявления их взаимосвязи. Если нужно проверить, имеется ли связь между интересом к вопросам нравственного воспитания и чтением литературы (газет, журналов, монографий по данной проблеме), то группировку следует сделать по этим двум признакам.
В социологическом исследовании, как правило, выделяется не одна, а несколько групп респондентов (по возрасту, образованию, месту проживания и т.п.). Каждой группе соответствует некоторое выделенное число (n1, n2,n3,…,nx), которое характеризует количественный состав группы. Такой ряд чисел, получаемый в результате группировки, социологи называют рядом распределения. Существуют два вида распределений: вариационный и атрибутивный. Вариационный ряд распределения основывается на количественных признаках изучаемых явлений, процессов, атрибутивный — отражает результаты группировки опрашиваемых по количественным признакам.
Таблица сопряженности признаков — форма представления данных об объектах социологического исследования на основе группировки двух или более признаков по принципу их сочетаемости. Наглядно можно представить лишь в виде набора двумерных срезов. Таблица сопряженности позволяет провести поградационный анализ влияния какого-либо признака на другие и визуальный экспресс-анализ взаимовлияния двух признаков. Таблицы сопряженности, образованные двумя признаками, называются двумерными. Для них разработано большинство мер связи, они более удобны для анализа и дают корректные и значимые результаты. Анализ многомерных таблиц сопряженности признаков в основном состоит из анализа составляющих ее маргинальных двумерных таблиц. Таблицы сопряженности признаков заполняются данными о частотах совместной встречаемости признаков, выраженных в абсолютном или процентном отношениях.
Существует два основных класса статистических выводов, которые делаются при анализе таблиц сопряжения: проверка гипотезы о независимости признаков и проверка гипотезы о связи между признаками.
Статистические методы анализа включают в себя:
анализ средних величин;
вариационный (дисперсионный) анализ;
изучение колебаний признака относительно его среднего значения;
кластерный (таксономический) анализ — классификацию признаков и объектов при отсутствии предварительных или экспертных данных о группировке информации;
логлинейный анализ — поиск и оценку взаимосвязей в таблице, сжатое описание табличных данных;
корреляционный анализ — установление зависимости между признаками;
факторный анализ — многомерный статистический анализ признаков, установление внутренних взаимосвязей признаков;
регрессионный анализ — изучение изменений значений результатирующего признака в зависимости от изменений признаков-факторов;
латентный анализ — выявление скрытых признаков объекта;
дискриминантный анализ — оценка качества экспертной классификации объектов социологического исследования.