Автор: Пользователь скрыл имя, 20 Октября 2011 в 17:34, курсовая работа
Целью данной работы является изучение современных статистических методов маркетинговых исследований на примере инвестиционных фондов.
Гипотезы:
Из представленных 11 факторов, характеризующих инвестиционные фонды, можно выделить 2-3 фактора, которые обеспечивают статистически значимый выбор фондов для эффективного вложения временно свободных средств;
Выбранные 2-3 фактора обеспечивают выбор не конкретного фонда, а групп фондов, удовлетворяющих определенным уровням этих факторов.
Введение. 3
1.Краткая характеристика взаимных фондов и факторов, характеризующих их деятельность 5
2. Определение типов исходных данных для взаимных фондов 6
3. Одномерная сводка и группировка инвестиционных фондов по качественным переменным 12
4. Составление статистических таблиц и гистограмм распределения для одномерных качественных переменных 13
5. Двумерная сводка и группировка инвестиционных фондов по качественным переменным. 15
7. Использование χ2 – критерия для проверки независимости двух качественных переменных 21
8. Одномерная сводка и группировка инвестиционных фондов по количественным(метрическим) переменным. Построение вариационных рядов. 24
9. Составление статистических таблиц и гистограмм распределения для одномерных количественных переменных. 25
10. Статистики, связанные с распределением частот. 27
11. Разведочный анализ качественных переменных с помощью кросстабуляции. 39
12. Разведочный анализ количественных переменных. 45
13.Определение доверительных границ для выборки объемом 25 единиц 51
Заключение 53
Из частотной таблицы видно, что 38 взаимных фонда, т.е 40%, имеют доходность в диапазоне от 9,525% до 12,65%, 22 взаимных фонда, т.е. примерно 23%, имеют доходность в диапазоне от 6,4% до 9,525 %.
Наглядное
представление о распределении
фондов под доходности дает гистограмма
приведенная ниже.
Рис. 5. Гистограмма «Пятилетняя доходность»
Ряды распределения, частотные таблицы и гистограммы легко читаются и содержат основную информацию, но иногда такая информация слишком детализована. Исследователь вынужден обобщать ее с помощью описательных статистик, которые являются более компактными и позволяют легче сравнивать различные совокупности. Обычно используют три группы статистик, связанных с распределением частот:
10.1 Показатели центра распределения
Показатели центра распределения характеризуют положение центра распределения, вокруг которого концентрируются данные, т.е. показывают центральную тенденцию распределения. Основными показателями центра распределения являются:
10.1.1 Среднее арифметическое или выборочное среднее
Среднее арифметическое или выборочное среднее – это наиболее часто используемый показатель, характеризующий положение центра распределения. Он используется для оценки среднего значения в случае, если данные собраны с помощью интервальной и относительной шкалы. Среднее арифметическое простое определяется соотношением (1):
где n – объем выборки или число членов ряда, i-го элемента выборки или i-го члена ряда, - сумма значений всех элементов выборки или сумма значений всех членов ряда.
Рассчитаем выборочное среднее простое для вариационного ряда переменной «Пятилетняя доходность», приведенного в табл.12
N | 5 летн.дох. | N | 5 летн.дох. | N | 5 летн.дох. | N | 5 летн.дох. |
1 | -6,1 | 26 | 9,2 | 51 | 11,3 | 76 | 13,3 |
2 | -1,2 | 27 | 9,3 | 52 | 11,3 | 77 | 13,3 |
3 | -0,7 | 28 | 9,3 | 53 | 11,4 | 78 | 13,7 |
4 | 2,5 | 29 | 9,4 | 54 | 11,5 | 79 | 13,9 |
5 | 4,3 | 30 | 9,4 | 55 | 11,5 | 80 | 14,2 |
6 | 4,4 | 31 | 9,5 | 56 | 11,5 | 81 | 14,7 |
7 | 4,5 | 32 | 9,5 | 57 | 11,7 | 82 | 14,9 |
8 | 5,4 | 33 | 9,6 | 58 | 11,7 | 83 | 15,2 |
9 | 6 | 34 | 9,7 | 59 | 11,9 | 84 | 15,4 |
10 | 6,3 | 35 | 9,8 | 60 | 12,1 | 85 | 15,6 |
11 | 6,5 | 36 | 9,9 | 61 | 12,2 | 86 | 15,7 |
12 | 6,6 | 37 | 10,2 | 62 | 12,2 | 87 | 15,8 |
13 | 6,6 | 38 | 10,3 | 63 | 12,2 | 88 | 16 |
14 | 7,6 | 39 | 10,6 | 64 | 12,3 | 89 | 16,5 |
15 | 7,9 | 40 | 10,7 | 65 | 12,3 | 90 | 16,9 |
16 | 8,2 | 41 | 10,7 | 66 | 12,3 | 91 | 17,7 |
17 | 8,2 | 42 | 10,8 | 67 | 12,5 | 92 | 18,1 |
18 | 8,3 | 43 | 10,9 | 68 | 12,5 | 93 | 18,2 |
19 | 8,4 | 44 | 11 | 69 | 12,5 | 94 | 18,5 |
20 | 8,4 | 45 | 11,1 | 70 | 12,6 | 95 | 18,9 |
21 | 8,5 | 46 | 11,1 | 71 | 12,7 | ||
22 | 8,5 | 47 | 11,1 | 72 | 12,9 | ||
23 | 8,8 | 48 | 11,1 | 73 | 12,9 | ||
24 | 9 | 49 | 11,2 | 74 | 12,9 | ||
25 | 9,1 | 50 | 11,2 | 75 | 13,1 |
=10,77
В случае представления данных переменной «5 летняя доходность» в виде частотной таблицы (см. табл. 2), определяют среднюю арифметическую взвешенную по формуле (2):
= (2)
где K - число интервалов группирования, - частота j-го интервала группирования,
– середина j-го интервала группирования, определяемая соотношением (3):
Определим, для примера середину 1-го интервала группирования из табл.2:
Табл.13. Частотная таблица переменной «5 летняя доходность»
От….До | Частота | Кумулятивная | Частость, % | Кумулятивная |
частота | частость, % | |||
-6,10000<=x<-2,97500 | 1 | 1 | 1,05263 | 1,0526 |
-2,97500<=x<,1500000 | 2 | 3 | 2,10526 | 3,1579 |
,1500000<=x<3,275000 | 1 | 4 | 1,05263 | 4,2105 |
3,275000<=x<6,400000 | 6 | 10 | 6,31579 | 10,5263 |
6,400000<=x<9,525000 | 22 | 32 | 23,15789 | 33,6842 |
9,525000<=x<12,65000 | 38 | 70 | 40,00000 | 73,6842 |
12,65000<=x<15,77500 | 16 | 86 | 16,84211 | 90,5263 |
15,77500<=x<18,90000 | 8 | 94 | 8,42105 | 98,9474 |
18,90000<=x<22,02500 | 1 | 95 | 1,05263 | 100,0000 |
22,02500<=x<25,15000 | 0 | 95 | 0,00000 | 100,0000 |
Итого | 0 | 95 | 0,00000 | 100,0000 |
Определим среднюю арифметическую взвешенную для данных табл.13:
Средняя
арифметическая взвешенная является приближенной
оценкой средней
10.1.2 Медиана
Медиана выборки – это значение переменной в середине ряда данных, расположенных в порядке возрастания (или убывания). Т.е. одна половина всех значений ряда меньше медианы, а вторая половина всех значений ряда больше медианы. Положение медианы определяется ее номером
nm , которое определяется соотношением (4):
Медиана является основным показателем центра распределения для данных, получаемых по порядковой шкале (т.е. категорийных, атрибутивных данных) и для метрических данных, содержащих выбросы (т.е. сильно отличающиеся данные).
Если число членов ряда является нечетным числом, например n = 97, то медианой будет значение 49 члена ряда. При этом 48 членов, стоящих перед 49 членом, будут иметь значения меньше или равные значению 49 члена, а 48 членов, стоящих после 49 члена, будут иметь значения больше или равные значению 49 члена.
Me =11,1
10.1.3 Мода
Мода – есть значение переменной, которое чаще всего встречается в выборочном распределении.
Мода является хорошим показателем центра распределения, если переменная имеет категорийный характер, т.е. данные можно разбить на категории.
Мода является единственным показателем центра распределения для данных, полученных по номинальной шкале.
Для данных, полученных по интервальной или относительной шкалам, мода плохо отражает положение центра распределения и используется сравнительно редко.
На рис.1 приведена гистограмма переменной «5- летняя доходность» (т.е. количественные данные), мода которой составляет Mo = 11,1
На рис.2
приведена гистограмма
Рис.
6
0
Рис.
7
Изменчивость можно определить как степень различий между отдельными значениями. Показатели вариации показывают меру разброса (изменчивости) значений переменной. Показатели вариации вычисляют на основании количественных данных, получаемых с помощью интервальных и относительных шкал. Используют следующие показатели вариации:
(Variance, Standard deviation- Std.Dev);
10.2.1 Размах вариации (Range);
Размах вариации R есть разность между наибольшим и наименьшим значениями переменной в вариационном ряду.
Для переменной «Пятилетняя доходность» (см. табл.1) получаем:
R = 18,9 –(-6,1) = 25%
Размах
вариации позволяет измерить общий
разброс. Хотя этот показатель является
простой оценкой вариации, его
недостаток заключается в том, что
он никак не учитывает распределение
данных между минимальным и максимальным
значениями.
10.2.2 Дисперсия и среднее квадратическое отклонение
Дисперсия S2 и среднее квадратическое отклонение S являются наиболее часто используемыми показателями вариации, т.к. они оценивают степень вариации данных относительно среднего значения. Выборочная дисперсия определяется выражением (7):
Обозначения в формуле (7) такие же, как и в формуле (1).
Среднее квадратическое отклонение (СКО) определяется выражением (8):
Информация о работе Маркетинговые исследования инвестиционных фондов