Автор: Пользователь скрыл имя, 07 Сентября 2011 в 04:43, статья
Анализ данных мониторинга общественного мнения, т.е. изменения с течением времени долей ответов респондентов по одной или нескольким градациям вопросов анкеты, наиболее часто изучают с помощью так называемого «глазомерного» метода, когда социолог рассматривает данные мониторинга и исходя из здравого смысла и знания изменений социально-экономической и политической ситуации в стране или регионе дает правдоподобное объяснение изменению долей ответов респондентов.
ã
2001 г.
А.А. ДАВЫДОВ,
А.Н. ЧУРАКОВ
СИСТЕМНЫЙ ПОДХОД К АНАЛИЗУ ДАННЫХ МОНИТОРИНГА ОБЩЕСТВЕННОГО МНЕНИЯ
ДАВЫДОВ Андрей Александрович - доктор философских наук, главный научный сотрудник Института социологии РАН, руководитель группы «Анализ социальных систем». ЧУРАКОВ Александр Николаевич - кандидат социологических наук, заведующий кафедрой информационных технологий в социологии Московского Государственного Социального Университета (МГСУ).
Анализ данных мониторинга общественного мнения, т.е. изменения с течением времени долей ответов респондентов по одной или нескольким градациям вопросов анкеты, наиболее часто изучают с помощью так называемого «глазомерного» метода, когда социолог рассматривает данные мониторинга и исходя из здравого смысла и знания изменений социально-экономической и политической ситуации в стране или регионе дает правдоподобное объяснение изменению долей ответов респондентов. Очевидно, что в этом случае истинность интерпретаций трудно проверить, а количество полезной информации, извлеченной из данных при помощи «глазомерного» метода, существенно ограничено.
Анализ
данных мониторинга общественного
мнения также традиционно осуществляют
с помощью статистического
С проникновением в эмпирическую социологию компьютерных информационных технологий [2] для анализа динамики используют компьютерные системы извлечения знаний - «data mining», которые методом полного перебора возможных вариантов выявляют различные закономерности в имеющихся эмпирических данных и где истинность полученных результатов определяется только исходя из точности описания и прогноза. Среди систем «data mining» наибольшее распространение получили так называемые «нейронные» сети [3]. Напомним, что «нейронная сеть» состоит из элементов «нейронов», которые размещены по m слоям, обычно трем. Первый слой - входной, второй - скрытый, третий - выходной. «Нейроны» первого слоя получают входные сигналы, преобразуют их по различным правилам, например, с помощью булевой логики, нечеткой логики, весовых коэффициентов, различных формул и т.д. и передают сигнал на другой слой. В процессе обучения на контрольных примерах, «нейронной сети» подаются на вход объекты с заданными характеристиками, а на выходе задают принадлежность объекта к определенному классу или какому-либо количественному значению. «Нейронная сеть» изменяет количество «нейронов», их состояния, количество слоев, правила преобразования для каждого «нейрона» до тех пор, пока точность предсказания принадлежности объекта к заданному классу или какому-либо количественному значению не будет максимальной. При этом неизвестно, по какому правилу сеть точно предсказывает результаты, т.к. «нейронная» сеть - это множество взаимосвязанных различных правил и формул.
Поскольку анализ временных рядов и «нейронные» сети не основаны на какой-либо социологической теории, то при анализе данных мониторинга общественного мнения с их помощью трудно получить теоретически обоснованные выводы, выдвигать новые плодотворные содержательные гипотезы и ставить новые перспективные исследовательские задачи. В этой связи предлагается использовать системный подход к анализу данных мониторинга общественного мнения, поскольку «глазомерный» подход, статистический подход и «нейронные» сети проигрывают системному подходу в богатстве возможных теоретических идей и гипотез, количестве содержательных и полезных для социологической теории и практики характеристик динамики систем, широте методов анализа данных мониторинга общественного мнения. Поскольку многие социологи не знакомы с количественным системным подходом, кратко дадим несколько пояснений, необходимых для правильного понимания представленных в данной статье эмпирических результатов [см. также: 4].
Данный подход основан на принципе системности, согласно которому существует зависимость каждого элемента, части, свойства и отношения от его места и функций внутри системы; каждая ее часть является системой, а исследуемая система является частью более общей системы; поведение системы есть результат взаимодействия всех свойств, отношений, элементов и уровней системы, влияния других социальных систем и окружающей среды, а также прошлого состояния системы и ожидаемого будущего. Наряду с принципом системности в системном подходе используются и другие принципы, в частности, принцип соразмерности частей [5], согласно которому в системе существует устойчивое количественное соответствие между размерами частей, необходимое для существования и функционирования системы. Это соответствие может быть выражено в виде прямых пропорциональных закономерностей , где - размеры частей, - коэффициент пропорциональности, аддитивных закономерностей вида , где - размеры частей системы, а также других классов закономерностей.
Рассматриваемый
подход базируется на принципе детерминизма,
т.е. наличии в системе
Мы решили эмпирически проверить, являются ли данные мониторинга общественного мнения системой. В качестве ее частей рассматриваются доли ответов респондентов на все вопросы анкеты. из системного принципа соразмерности частей вытекает, что в системе существуют устойчивые количественные отношения между размерами частей в системе, то их наличие в эмпирических данных будет эмпирическим свидетельством того факта, что данные мониторинга общественного мнения являются системой.
Мы проанализировали данные мониторинга общественного мнения, проводимого Всероссийским центром изучения общественного мнения (ВЦИОМ)1 за период 1994 - 2001 гг. (данные, а также ценные рекомендации по их анализу любезно предоставлены Алексеем Ивановичем Гражданкиным - зам. директора ВЦИОМ) с помощью компьютерной экспертно - диагностической системы МАКС (версия 3.1) [6], в которой реализован поиск различных вариантов зависимостей методом полного перебора.
Напомним, что данные мониторинга ВЦИОМ представляют собой распределение ответов респондентов на 32 вопроса, при этом опросы проводится через каждые два месяца на выборке, репрезентирующей по основным социально-демографическим характеристикам население России. В силу ограниченности данной статьи мы приведем только три класса (1-3) найденных нами устойчивых закономерностей в данных мониторинга общественного мнения ВЦИОМ.
Прямые пропорциональные закономерности. (I) , где - доли ответов респондентов по разным градациям различных вопросов, - коэффициент пропорциональности.
Аддитивные закономерности. (II) , где - доли ответов респондентов по разным градациям различных вопросов.
Мультипликативные закономерности. (III) , где - доли ответов респондентов по разным градациям различных вопросов.
Скажем сразу, что в данных мониторинга общественного мнения ВЦИОМ обнаружены устойчивые для периода 1994 - 2001 гг. известные системные закономерности (1-3) между размерами частей в системе.
Прямо пропорциональные закономерности (I). Для порогового значения вариации коэффициента пропорциональности , не превышающего 10%, было найдено 28 прямо пропорциональных закономерностей, часть из которых указана ниже. Отметим, что это составляет 0,2% от всех логических возможных комбинаций двух долей ответов в данных мониторинга. Для удобства описания примера придадим каждой доли ответов на тот или иной вопрос последовательную числовую нумерацию: Примеры прямо пропорциональных закономерностей
Как
бы вы оценили экономическое
Отметим, что остатки для всех найденных прямо пропорциональных закономерностей распределены нормально, поскольку эмпирические значения статистики Колмогорова-Смирнова не превышают табличных значений. Это означает следующее. Распределение погрешностей формируется под воздействием очень большого числа взаимно независимых факторов, причем воздействие каждого отдельного фактора мало, равновероятно по знаку и не может доминировать среди остальных. Последовательный характер воздействия случайных факторов на величину погрешности - аддитивный, т.е. влияние каждого случайного фактора суммируется. Иными словами, погрешности приближения можно
Таблица 1
Количество найденных закономерностей (II) для двух слагаемых при различных величинах абсолютной погрешности
|
признать зависящими от многих случайных факторов, а выявленные нами закономерности не являются случайными.
Аддитивные закономерности (II). Полученные нами результаты представлены в табл. 1, где указано количество найденных закономерностей (II) для двух слагаемых при различных величинах абсолютного порога погрешности приближения. Под обобщенными частотными распределениями понимались одномерные частотные распределения ответов респондентов, в котором каждая градация представляла собой сумму абсолютных частот ответов респондентов за весь анализируемый период. Иными словами, данные обобщенные частотные распределения отражают распределение ответов в целом за период 1994-2001 гг. Из табл. 1 вытекает, что на обобщенных частотных распределениях наблюдается больше закономерностей (II) для двух слагаемых. Это может быть связано с тем, что при увеличении объема наблюдений величина абсолютной погрешности уменьшается и существует больше закономерностей, чем при анализе динамики. Здесь просматривается аналогия с законом больших чисел в математической статистике. Напомним, что в соответствии с законом больших чисел сумма большого числа независимых случайных величин утрачивает характер случайной величины и становится близкой к некоторой константе.
Статистический анализ абсолютных погрешностей найденных закономерностей (II) для двух слагаемых за период 1994 - 2001 гг. показал, что распределение погрешностей в достаточно большом числе случаев приближенно описывается нормальным распределением, поскольку эмпирические значения статистики Колмогорова-Смирнова не превышают табличных значений. Иными словами, погрешности приближения можно признать зависящими от многих случайных факторов, а выявленные нами закономерности не являются случайными.
Мы проанализировали согласованность изменений долей ответов из найденных нами закономерностей (II) для двух слагаемых с помощью коэффициентов кросскорреляции, используемых для анализа временных рядов [1]. Оказалось, что доли ответов в найденных нами закономерностях действительно изменяются согласованно, т.е. наибольшие значения коэффициентов кросскорреляции наблюдались при лаге (запаздывании) равном нулю. Таким образом, имеются основания полагать, что найденные нами закономерности (II) для двух слагаемых описывают не отношения между постоянными величинами или величинами, которые случайным образом изменяются в некотором интервале, а функциональные зависимости.
Информация о работе Системный подход к анализу данных мониторинга общественного мнения