Системный подход к анализу данных мониторинга общественного мнения

Автор: Пользователь скрыл имя, 07 Сентября 2011 в 04:43, статья

Краткое описание

Анализ данных мониторинга общественного мнения, т.е. изменения с течением времени долей ответов респондентов по одной или нескольким градациям вопросов анкеты, наиболее часто изучают с помощью так называемого «глазомерного» метода, когда социолог рассматривает данные мониторинга и исходя из здравого смысла и знания изменений социально-экономической и политической ситуации в стране или регионе дает правдоподобное объяснение изменению долей ответов респондентов.

Файлы: 1 файл

Давыдов А.А., А.Н. Чураков - Системный подход к анализу данных мониторинга общественного мнения.doc

— 127.00 Кб (Скачать)
 

ã 2001 г. 

А.А. ДАВЫДОВ, А.Н. ЧУРАКОВ 

СИСТЕМНЫЙ ПОДХОД К АНАЛИЗУ ДАННЫХ МОНИТОРИНГА  ОБЩЕСТВЕННОГО МНЕНИЯ

      ДАВЫДОВ Андрей Александрович - доктор философских  наук, главный научный  сотрудник Института  социологии РАН, руководитель группы «Анализ социальных систем». ЧУРАКОВ Александр Николаевич - кандидат социологических наук, заведующий кафедрой информационных технологий в социологии Московского Государственного Социального Университета (МГСУ).

 

      Анализ  данных мониторинга общественного  мнения, т.е. изменения с течением времени долей ответов респондентов по одной или нескольким градациям вопросов анкеты, наиболее часто изучают с помощью так называемого «глазомерного» метода, когда социолог рассматривает данные мониторинга и исходя из здравого смысла и знания изменений социально-экономической и политической ситуации в стране или регионе дает правдоподобное объяснение изменению долей ответов респондентов. Очевидно, что в этом случае истинность интерпретаций трудно проверить, а количество полезной информации, извлеченной из данных при помощи «глазомерного» метода, существенно ограничено.

      Анализ  данных мониторинга общественного  мнения также традиционно осуществляют с помощью статистического подхода, в частности анализа временных  рядов. При этом доли ответов (в процентах) респондентов по одной или нескольким градациям одного или различных вопросов анализируют с помощью коэффициентов автокорреляции и кросскорреляции, методов авторегрессии, скользящего среднего, спектрального анализа и некоторых других методов [1]. Напомним, что методы статистического анализа временных рядов направлены на выделение во временном ряде тренда (долговременной составляющей временного ряда), сезонной и циклической компонент, случайной составляющей и ряда других признаков, выявление связи и лагов (запаздываний) между временными рядами и т.д. При данном статистическом подходе истинность полученных результатов основывается на точности описания и предсказания и на возможности содержательно объяснить полученный результат, как правило, с точки зрения здравого смысла, поскольку статистический анализ временных рядов не основан на какой-либо социологической теории, а представляет собой раздел математической статистики, который безразличен к содержательной специфике временного ряда.

      С проникновением в эмпирическую социологию компьютерных информационных технологий [2] для анализа динамики используют компьютерные системы извлечения знаний - «data mining», которые методом полного перебора возможных вариантов выявляют различные закономерности в имеющихся эмпирических данных и где истинность полученных результатов определяется только исходя из точности описания и прогноза. Среди систем «data mining» наибольшее распространение получили так называемые «нейронные» сети [3]. Напомним, что «нейронная сеть» состоит из элементов «нейронов», которые размещены по m слоям, обычно трем. Первый слой - входной, второй - скрытый, третий - выходной. «Нейроны» первого слоя получают входные сигналы, преобразуют их по различным правилам, например, с помощью булевой логики, нечеткой логики, весовых коэффициентов, различных формул и т.д. и передают сигнал на другой слой. В процессе обучения на контрольных примерах, «нейронной сети» подаются на вход объекты с заданными характеристиками, а на выходе задают принадлежность объекта к определенному классу или какому-либо количественному значению. «Нейронная сеть» изменяет количество «нейронов», их состояния, количество слоев, правила преобразования для каждого «нейрона» до тех пор, пока точность предсказания принадлежности объекта к заданному классу или какому-либо количественному значению не будет максимальной. При этом неизвестно, по какому правилу сеть точно предсказывает результаты, т.к. «нейронная» сеть - это множество взаимосвязанных различных правил и формул.

      Поскольку анализ временных рядов и «нейронные» сети не основаны на какой-либо социологической теории, то при анализе данных мониторинга общественного мнения с их помощью трудно получить теоретически обоснованные выводы, выдвигать новые плодотворные содержательные гипотезы и ставить новые перспективные исследовательские задачи. В этой связи предлагается использовать системный подход к анализу данных мониторинга общественного мнения, поскольку «глазомерный» подход, статистический подход и «нейронные» сети проигрывают системному подходу в богатстве возможных теоретических идей и гипотез, количестве содержательных и полезных для социологической теории и практики характеристик динамики систем, широте методов анализа данных мониторинга общественного мнения. Поскольку многие социологи не знакомы с количественным системным подходом, кратко дадим несколько пояснений, необходимых для правильного понимания представленных в данной статье эмпирических результатов [см. также: 4].

      Данный  подход основан на принципе системности, согласно которому существует зависимость каждого элемента, части, свойства и отношения от его места и функций внутри системы; каждая ее часть является системой, а исследуемая система является частью более общей системы; поведение системы есть результат взаимодействия всех свойств, отношений, элементов и уровней системы, влияния других социальных систем и окружающей среды, а также прошлого состояния системы и ожидаемого будущего. Наряду с принципом системности в системном подходе используются и другие принципы, в частности, принцип соразмерности частей [5], согласно которому в системе существует устойчивое количественное соответствие между размерами частей, необходимое для существования и функционирования системы. Это соответствие может быть выражено в виде прямых пропорциональных закономерностей , где - размеры частей, - коэффициент пропорциональности, аддитивных закономерностей вида , где - размеры частей системы, а также других классов закономерностей.

      Рассматриваемый подход базируется на принципе детерминизма, т.е. наличии в системе детерминистских  законов и закономерностей, т.е. необходимых  устойчивых связей между ее элементами и частями. Среди методов выявления закономерностей в системах часто используется метод полного перебора вариантов в уже собранных эмпирических данных. Этот метод обусловлен принципом целостности, согласно которому для успешного анализа и прогнозирования функционирования системы необходимо рассматривать всю систему как единое целое, при учете всех закономерностей, которые обуславливают ее строение и динамику. Кроме того, в силу значительной уникальности каждой системы трудно предварительно сказать, какие количественные закономерности могут наблюдаться в конкретной социальной системе в данный момент времени, а какие закономерности наблюдаться не должны. Истинность полученных результатов определяется здесь прежде всего исходя из соответствия полученных результатов известным системным принципам и общим законам, количественных критериев точности описания и прогнозирования, устойчивости закономерностей в рамках длительного периода. При этом также используется принцип ограниченности, согласно которому в силу принципиальной неполноты наших теоретических и эмпирических знаний о сложной развивающейся системе, ограниченности периода наблюдения и фрагментарности эмпирических данных, имеющихся погрешностях измерения, теоретических, психологических, культурных, этических и иных ограничениях исследователя, допускается отсутствие содержательных объяснений полученных результатов, а объяснения с точки зрения здравого смысла не считаются обоснованными.

      Мы  решили эмпирически проверить, являются ли данные мониторинга общественного  мнения системой. В качестве ее частей рассматриваются доли ответов респондентов на все вопросы анкеты.  из системного принципа соразмерности частей вытекает, что в системе существуют устойчивые количественные отношения между размерами частей в системе, то их наличие в эмпирических данных будет эмпирическим свидетельством того факта, что данные мониторинга общественного мнения являются системой.

      Мы  проанализировали данные мониторинга  общественного мнения, проводимого  Всероссийским центром изучения общественного мнения (ВЦИОМ)1 за период 1994 - 2001 гг. (данные, а также ценные рекомендации по их анализу любезно предоставлены Алексеем Ивановичем Гражданкиным - зам. директора ВЦИОМ) с помощью компьютерной экспертно - диагностической системы МАКС (версия 3.1) [6], в которой реализован поиск различных вариантов зависимостей методом полного перебора.

      Напомним, что данные мониторинга ВЦИОМ  представляют собой распределение  ответов респондентов на 32 вопроса, при этом опросы проводится через  каждые два месяца на выборке, репрезентирующей по основным социально-демографическим характеристикам население России. В силу ограниченности данной статьи мы приведем только три класса (1-3) найденных нами устойчивых закономерностей в данных мониторинга общественного мнения ВЦИОМ.

      Прямые  пропорциональные закономерности. (I) , где - доли ответов респондентов по разным градациям различных вопросов, - коэффициент пропорциональности.

      Аддитивные  закономерности. (II) , где - доли ответов респондентов по разным градациям различных вопросов.

      Мультипликативные закономерности. (III) , где - доли ответов респондентов по разным градациям различных вопросов.

      Скажем сразу, что в данных мониторинга общественного мнения ВЦИОМ обнаружены устойчивые для периода 1994 - 2001 гг. известные системные закономерности (1-3) между размерами частей в системе.

      Прямо пропорциональные закономерности (I). Для порогового значения вариации коэффициента пропорциональности , не превышающего 10%, было найдено 28 прямо пропорциональных закономерностей, часть из которых указана ниже. Отметим, что это составляет 0,2% от всех логических возможных комбинаций двух долей ответов в данных мониторинга. Для удобства описания примера придадим каждой доли ответов на тот или иной вопрос последовательную числовую нумерацию: Примеры прямо пропорциональных закономерностей

      Как бы вы оценили экономическое положение  России? (плохое) - 1; Как бы вы оценили в настоящее время материальное положение вашей семьи? (плохое) - 2; Как бы вы оценили в целом политическую обстановку в России? (напряженная) - 3; Как бы вы оценили в настоящее время материальное положение вашей семьи? (среднее) - 4; Как вы считает, какое из приведенных ниже высказываний более соответствует сложившейся ситуации? (жить трудно, но можно терпеть) - 5; Что бы вы могли сказать о своем настроении в последние дни? (испытываю напряжение, раздражение) - 6; Как вы думаете, что ожидает Россию в ближайшие месяцы в политической жизни? (некоторое улучшение ситуации) - 7; Каким из следующих суждений о прожиточном минимуме вы бы скорее согласились? (это такой уровень доходов, который обеспечивает человеку скромное, но более-менее приличное существование) - 8; Как бы вы оценили экономическое положение в вашем городе, сельском районе? (плохое) - 9; Если такого рода митинги, демонстрации протеста состоятся, вы лично примете в них участие или нет? (скорее всего, нет) - 10; Как вы думаете, что ожидает Россию в ближайшие месяцы в области экономики? (некоторое улучшение ситуации) - 11; Как вы считаете, экономические реформы сейчас нужно продолжать или их следует прекратить? (следует прекратить) - 12. Получены следующие закономерности: (1)=0,679 х (8); (2)=0,839 х (9); (3)=0,991 х (10); (4)=0,921 х (5); (1)=0,857 х (3); (5)= 0,776 х (10); (6)=1,073 х (2); (7)=1,017 х (11); (6)=1,498 х (12).

      Отметим, что остатки для всех найденных  прямо пропорциональных закономерностей  распределены нормально, поскольку эмпирические значения статистики Колмогорова-Смирнова не превышают табличных значений. Это означает следующее. Распределение погрешностей формируется под воздействием очень большого числа взаимно независимых факторов, причем воздействие каждого отдельного фактора мало, равновероятно по знаку и не может доминировать среди остальных. Последовательный характер воздействия случайных факторов на величину погрешности - аддитивный, т.е. влияние каждого случайного фактора суммируется. Иными словами, погрешности приближения можно

 

      

Таблица 1

Количество  найденных закономерностей (II) для  двух слагаемых при различных  величинах абсолютной погрешности 

Абсолютная  погрешность, % Весь мониторинг Мониторинг  без градаций «затрудняюсь ответить»  и рейтинга политиков Обобщенные частотные распределения
0,0 0 0 879
0,5 2 0 32653
1,0 26 10 64611
1,5 143 40 96347
2,0 381 75 128119
2,5 908 132 159803
3,0 1762 238 191169
 

 

      признать  зависящими от многих случайных факторов, а выявленные нами закономерности не являются случайными.

      Аддитивные  закономерности (II). Полученные нами результаты представлены в табл. 1, где указано количество найденных закономерностей (II) для двух слагаемых при различных величинах абсолютного порога погрешности приближения. Под обобщенными частотными распределениями понимались одномерные частотные распределения ответов респондентов, в котором каждая градация представляла собой сумму абсолютных частот ответов респондентов за весь анализируемый период. Иными словами, данные обобщенные частотные распределения отражают распределение ответов в целом за период 1994-2001 гг. Из табл. 1 вытекает, что на обобщенных частотных распределениях наблюдается больше закономерностей (II) для двух слагаемых. Это может быть связано с тем, что при увеличении объема наблюдений величина абсолютной погрешности уменьшается и существует больше закономерностей, чем при анализе динамики. Здесь просматривается аналогия с законом больших чисел в математической статистике. Напомним, что в соответствии с законом больших чисел сумма большого числа независимых случайных величин утрачивает характер случайной величины и становится близкой к некоторой константе.

      Статистический  анализ абсолютных погрешностей найденных  закономерностей (II) для двух слагаемых за период 1994 - 2001 гг. показал, что распределение погрешностей в достаточно большом числе случаев приближенно описывается нормальным распределением, поскольку эмпирические значения статистики Колмогорова-Смирнова не превышают табличных значений. Иными словами, погрешности приближения можно признать зависящими от многих случайных факторов, а выявленные нами закономерности не являются случайными.

      Мы  проанализировали согласованность  изменений долей ответов из найденных  нами закономерностей (II) для двух слагаемых с помощью коэффициентов кросскорреляции, используемых для анализа временных рядов [1]. Оказалось, что доли ответов в найденных нами закономерностях действительно изменяются согласованно, т.е. наибольшие значения коэффициентов кросскорреляции наблюдались при лаге (запаздывании) равном нулю. Таким образом, имеются основания полагать, что найденные нами закономерности (II) для двух слагаемых описывают не отношения между постоянными величинами или величинами, которые случайным образом изменяются в некотором интервале, а функциональные зависимости.

Информация о работе Системный подход к анализу данных мониторинга общественного мнения