Хранилище данных "Прокат автотранспорта"

Автор: Пользователь скрыл имя, 13 Ноября 2015 в 13:14, курсовая работа

Краткое описание

Задачей данного проекта является разработка системы поддержки принятия решений на основе хранилищ данных в предметной области «Фирма, разрабатывающая программное обеспечение».
Объектом проекта является предоставляемые функциональные возможности Microsoft Visual Studio 2012, Microsoft SQL Server 2008 и его служб.
Цель курсового проекта состоит в создании хранилища данных для предметной области «Фирма, разрабатывающая программное обеспечение».

Файлы: 1 файл

Записка.docx

— 2.26 Мб (Скачать)

СОДЕРЖАНИЕ

 

 

ВВЕДЕНИЕ

Системы поддержки принятия решений - это компьютерные системы, почти всегда интерактивные, разработанные, чтобы помочь менеджеру (или руководителю) в принятии решений. СППР включают и данные, и модели, чтобы помочь принимающему решения решить проблемы, особенно те, которые плохо формализованы.

Несмотря на то, что история исследований задач и процессов принятия решений восходит к 1738г., когда Бернулли и Ла Плас установили логарифмическую форму нелинейной функции полезности денег, актуальность они не потеряли. Применение СППР основано на экономической целесообразности и определяется сложностью задач, которые решают с их помощью [3].

 Итак, система поддержки принятия решений – компьютерная автоматизированная система, целью которой является помощь людям, принимающим решение в сложных условиях для полного и объективного анализа предметной деятельности. Системы поддержки принятия решений возникли в результате слияния управленческих информационных систем и систем управления базами данных [1].

Стратегия научно-технического прогресса в современных условиях формирования развивающихся информационных систем управления объектами разного уровня и назначения, в том числе и систем поддержки принятия решений , предполагает значительное повышение интеллектуального уровня процессов их функционирования. Это направление исследований все еще мало разработано как в теоретическом, так и практическом аспекте. Дело в том, что перед интеллектуализацией СППР стоят весьма сложные проблемы. Одним из направлений интеллектуализации СППР есть использование базы знаний при принятии решений.

Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

Данные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

Для хранения данных используются базы данных - организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей; для хранения знаний – базы знаний - это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. База знаний – основа любой интеллектуальной системы.

Задачей данного проекта является разработка системы поддержки принятия решений на основе хранилищ данных в предметной области «Фирма, разрабатывающая программное обеспечение».

Объектом проекта является предоставляемые функциональные возможности Microsoft Visual Studio 2012, Microsoft SQL Server 2008 и его служб.

Цель курсового проекта состоит в создании хранилища данных для предметной области «Фирма, разрабатывающая программное обеспечение».

Предметом изучения являются способы автоматизации сбора данных и их анализа с целью последующего принятия решений.

 

  1. ТЕОРЕТИЧЕСКИЙ РАЗДЕЛ

    1. Понятие хранилища данных

В процессе развития компании происходит активное становление ее информационной инфраструктуры. Возникают все новые и новые информационные системы, происходит постоянное совершенствование существующих. В геометрической прогрессии начинает возрастать объем данных, которыми оперирует компания.

Начинают возникать архивы данных, какие-то элементы базы знаний и т. п. С определенного момента в компании появляются аналитики, задача которых «смотреть вперед», анализировать текущую ситуацию, строить прогнозы на будущее. Что, в конечном счете, позволяет руководству компании на принципиально новом уровне видеть полную картину состояния бизнеса, строить политику принятия управленческих решений.

Все это требует построения специализированных информационно - аналитических систем. Какую бы систему ни выбрала компания — самописную или серьезную промышленную, в любом случае возникает необходимость консолидации всех имеющихся данных. Для этого необходимо создание хранилищ данных. Процесс создания хранилищ данных – это процесс сбора, отсеивания и предварительной обработки данных с целью предоставления результирующей информации пользователям для статистического анализа (а нередко и создания аналитических отчетов).

Хранилище данных — ориентированная на поддержку управленческих решений автоматизированная система, состоящая из организационной структуры, технических средств, базы или совокупности базы данных (БД) и ПО, которое выполняет, как правило, следующие функции:

  1. извлечение данных из разрозненных источников, их трансформация и загрузка в хранилище;
  2. администрирование данных и хранилища;
  3. извлечение данных из хранилища, аналитическая обработка и представление данных конечным пользователям.

Обеспечить выполнение данных функций в рамках одного и того же продукта зачастую не удается. Поэтому для реализации хранилищ данных обычно используется несколько продуктов, одни их которых представляют собой собственно средства хранения данных, другие – средства их извлечения и просмотра, третьи – средства их пополнения [6].

Типичное хранилище данных, как правило, отличается от обычной реляционной базы данных.

Во-первых, обычные базы данных предназначены для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений. Например, продажа товара и выписка счета производятся с использованием базы данных, предназначенной для обработки транзакций, а анализ динамики продаж за несколько лет, позволяющий спланировать работу с поставщиками, – с помощью хранилища данных.

Во-вторых, обычные базы данных подвержены постоянным изменениям в процессе работы пользователей, а хранилище данных относительно стабильно: данные в нем обычно обновляются согласно расписанию (например, еженедельно, ежедневно или ежечасно – в зависимости от потребностей). В идеале процесс пополнения представляет собой просто добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище.

И, в-третьих, обычные базы данных чаще всего являются источником данных, попадающих в хранилище. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов [3].

    1. Структура хранилища данных

В основе концепции хранилища данных лежат две основные идеи - интеграция разъединенных детализированных данных (детализированных в том смысле, что они описывают некоторые конкретные факты, свойства, события и т.д.) в едином хранилище и разделение наборов данных и приложений, используемых для оперативной обработки и применяемых для решения задач анализа. Определение понятия "хранилище данных" первым дал Уильям Г. Инмон в своей монографии. В ней он определил хранилище данных как "предметно-ориентированную, интегрированную, содержащую исторические данные, не разрушаемую совокупность данных, предназначенную для поддержки принятия управленческих решений".

Концептуально модель хранилища данных можно представить в виде схемы, показанной на рисунке 1.1.

Рисунок 1.1 – Концептуальная модель хранилища данных

Данные из различных источников помещаются в хранилище данных, а описания этих данных в репозиторий метаданных. Конечный пользователь, используя различные инструменты (средства визуализации, построения отчетов, статистической обработки и т.д.) и содержимое репозитория, анализирует данные в хранилище. Результатом его деятельности является информация в виде готовых отчетов, найденных скрытых закономерностей, каких-либо прогнозов. Так как средства работы конечного пользователя с хранилищем данных могут быть самыми разнообразными, то теоретически их выбор не должен влиять на его структуру и функции его поддержания в актуальном состоянии.

Но физическая реализация приведенной концептуальной схемы может быть самой разнообразной.

Главные преимущества хранилищ данных:

  1. единый источник информации: компания получает выверенную единую информационную среду, на которой будут строиться все справочно-аналитические приложения в той предметной области, по которой построено хранилище. Эта среда будет обладать единым интерфейсом, унифицированными структурами хранения, общими справочниками и другими корпоративными стандартами, что облегчает создание и поддержку аналитических систем. Также, при проектировании информационного хранилища данных особое внимание уделяют достоверности информации, которая попадает в хранилище;
  2. производительность: физические структуры хранилища данных специальным образом оптимизированы для выполнения абсолютно произвольных выборок, что позволяет строить действительно быстрые системы запросов;
  3. быстрота разработки: специфическая логическая организация хранилища и существующее специализированное ПО позволяют создавать аналитические системы с минимальными затратами на программирование;
  4. интегрированность: интеграция данных из разных источников уже сделана, поэтому не надо каждый раз производить соединение данных для запросов, требующих информацию из нескольких источников. Под интеграцией понимается не только совместное физическое хранение данных, но и их предметное, согласованное объединение; очистку и выверку при их формировании; соблюдение технологических особенностей и т.д.;
  5. историчность и стабильность: OLTP-системы оперируют с актуальными данными, срок применения и хранения которых обычно не превышает величины текущего бизнес-периода (полугода-год), в то время как информационное хранилище данных нацелено на долговременное хранение информации в течение 10-15 лет. Стабильность означает, что фактическая информация в хранилище данных не обновляется и не удаляется, а только специальным образом адаптируется к изменениям бизнесс-атрибутов. Таким образом, появляется возможность осуществлять исторический анализ информации;
  6. независимость: выделенность информационного хранилища существенно снижает нагрузку на OLTP-системы со стороны аналитических приложений, тем самым производительность существующих систем не ухудшается, а на практике происходит уменьшение времени отклика и улучшение доступности систем [5].
    1. Информационно-аналитические системы принятия решений

Эффективность работы организации и сложность анализа ее деятельности напрямую зависит от того, как организована обработка информации и поддержка информационных процессов. В последнее время особую актуальность приобрели различные компьютерные системы автоматизации и анализа информации. Подобные системы внедряются на производственных предприятиях, в организациях по продаже товаров, в сфере потребительских услуг и производстве нематериальной продукции. Следует заметить, что информационно-аналитические системы (ИАС) играют объединяющую роль, консолидируют разрозненные информационные технологии в единую интегрированную информационную систему управления предприятием.

ИАС – это компьютерная система, позволяющая получать информацию, создавать ее и производить ее обработку и анализ. Система должна предоставлять возможность сбора и обработки оперативной информации в режиме реального времени с удобным интерфейсом. Статистическая и аналитическая информация должна предоставляться в соответствии с любыми возникающими запросами с возможностью дальнейшей детализации.

Основной целью создания ИАС является преобразование информационного базиса организации в структурированную информационную среду, развивающуюся в соответствии с заранее намеченным планом, являющуюся источником информации, отвечающей насущным потребностям организации.

Одной из важнейших задач ИАС является преодоление кризиса оперативного анализа или, как его называют в англоязычной литературе, Data in Jail (DIJ) – «данные в тюрьме». Смысл в том, что при обилии исходных данных без квалифицированного использования, их пользователь не в состоянии извлечь из них информацию и приобрести знания о процессах, происходящих в той или иной предметной области.

Основными задачами любой ИАС являются эффективное хранение, обработка и анализ данных, главным образом, при подготовке и принятии решения. Поддержка принятия решений на основе накопленных данных может выполняться в трех базовых сферах: детализированных данных, агрегированных показателей и закономерностей.

Сфера детализированных данных – это область действия большинства систем, нацеленных на поиск информации. В большинстве случаев реляционные СУБД отлично справляются с возникающими здесь задачами. Общепризнанным стандартом языка манипулирования реляционными данными является SQL.

Сфера агрегированных показателей - комплексный взгляд на собранную в хранилище данных информацию, ее обобщение и агрегация, гиперкубическое представление и многомерный анализ являются задачами систем оперативной аналитической обработки данных – On-Line Analytical Processing (OLAP).

Информация о работе Хранилище данных "Прокат автотранспорта"