Автор: Пользователь скрыл имя, 31 Марта 2014 в 05:52, лекция
Широкому внедрению методов прикладной статистики способствовало появление ПК. Появление мощных и удобных пакетов для анализа данных на ПК резко расширило и изменило круг их потребителей. Если раньше эти методы использовались как инструмент научных исследований, то сейчас основными потребителями статистических пакетов стали коммерческие, финансовые организации, медицинские и правительственные учреждения.
На Западе (и уже в России) такие пакеты стали типичным общепотребительным инструментом плановых, аналитических, маркетинговых отделов производственных и торговых корпораций, банков и страховых компаний, правительственных и других учреждений. Потребность в средствах статистического анализа данных на Западе очень велика, что и послужило причиной для развития рынка статистических программ.
Тема 2. Средства анализа данных на ПК
Широкому внедрению методов прикладной статистики способствовало появление ПК. Появление мощных и удобных пакетов для анализа данных на ПК резко расширило и изменило круг их потребителей. Если раньше эти методы использовались как инструмент научных исследований, то сейчас основными потребителями статистических пакетов стали коммерческие, финансовые организации, медицинские и правительственные учреждения.
На Западе (и уже в России) такие пакеты стали типичным общепотребительным инструментом плановых, аналитических, маркетинговых отделов производственных и торговых корпораций, банков и страховых компаний, правительственных и других учреждений. Потребность в средствах статистического анализа данных на Западе очень велика, что и послужило причиной для развития рынка статистических программ.
Информацию о новых версиях пакетов, цены и адреса фирм-поставщиков можно найти в популярных компьютерных журналах и газетах типа «PC Magazine», “PC World”, “BYTE”, “PC Week” и др., а также «Мир ПК» и Интернет.
Число статистических пакетов, получивших распространение в России, достаточно велико и спрос на них вырос в середине 90-х годов.
Из зарубежных пакетов это STATGRAPHICS, SPSS, SYSTAT, BMDP, SAS, CSS, STATISTICA и др.
Из отечественных: STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП, СТАТЭКСПЕРТ и др.
Модульная структура системы STATISTICA
Статистические процедуры системы STATISTICA сгруппированы в несколько специализированных статистических модулях в соответствии с разделами статистического анализа.
Модуль Основные статистики и таблицы (Basic Statistics/Tables) содержит процедуры, наиболее часто используемые на начальном этапе обработки данных. Основные описательные статистики, методы статистического анализа различных таблиц, разносторонний инструментарий для разведечного анализа (медиану, моду, выборочное среднее и дисперсия, ассиметрия и эксцесс и др. описательные статистики. Выбор критериев для тестирования нормальности распределения).Имеется специальная процедура иерархической классификации, всесторонняя графическая поддержка на любых этапах анализа, корреляции, t –критерии для зависимых и независимых выборок, вероятностный калькулятор и другие возможности.
Модуль Множественная регрессия (Multiple Regression) включает в себя набор средств множественной линейной и нелинейной (полиноминальной, экспоненциальной, логарифмической и др.) регрессии, включая пошаговые, и другие методы. Позволяет вычислить набор статистик, включая полную регрессионную таблицу, частные корреляции и ковариации, подробный численный и визуальный анализ остатков, статистики Дарбина –Уотсона и другие. Прогнозирование с помощью моделей регрессии.
Модуль Дискриминантного анализа (Discriminant Analysis) содержит стандартный анализ, пошаговый анализ с включением или исключением переменных в модели. Канонический анализ и графики. Анализ результатов: расстояния между группами, классификация наблюдений, функции классификации, расстояния Махаланобиса.
Модуль Факторный анализ (Factor Analysis) содержит широкий набор методов факторного анализа и анализа главных компонент, метод минимальных
остатков и метод максимального правдоподобия с широким набором аналитических графиков, в том числе каменистой осыпи.
Модуль Кластерный анализ (Claster Analysis) содержит всесторонний инструментарий для кластеризации: метод к – средних, древовидная кластеризация, метод двухвходового объединения. Различные меры расстояний и правила объединения, разнообразные графики и диаграммы.
Модуль Анализ временных рядов и прогнозирование (Time Series/Forecasting) содержит методы анализа временных рядов и прогнозирования. Состоит из нескольких различных процедур преобразования исходного ряда: исключение среднего, тренда, взвешенного скользящего среднего, медианное сглаживание, автокорреляции, фильтрации, построения различных стандартных, аддитивных и мультипликативных прогнозных моделей и их графическое представление. Содержит всесторонний инструментарий для оценки адекватности моделей.