Автор: Пользователь скрыл имя, 13 Ноября 2015 в 13:14, курсовая работа
Задачей данного проекта является разработка системы поддержки принятия решений на основе хранилищ данных в предметной области «Фирма, разрабатывающая программное обеспечение».
Объектом проекта является предоставляемые функциональные возможности Microsoft Visual Studio 2012, Microsoft SQL Server 2008 и его служб.
Цель курсового проекта состоит в создании хранилища данных для предметной области «Фирма, разрабатывающая программное обеспечение».
Сфера закономерностей - интеллектуальная обработка производится методами интеллектуального анализа данных, главными задачами которых являются поиск функциональных и логических закономерностей в накопленной информации, построение моделей и правил, которые объясняют найденные аномалии и / или прогнозируют развитие некоторых процессов.
Такой трехмерный массив в терминах OLAP и называется кубом. У настоящего куба количество элементов во всех измерениях должно быть одинаковым, а у кубов OLAP такого ограничения нет. Тем не менее, несмотря на эти детали, термин «куб OLAP» ввиду своей краткости и образности стал общепринятым.
Предметная область функциональной модели – учет заказов на разработку программного обеспечения. Объектом моделирования функциональной модели служит компьютерная фирма, занимающаяся следующими аспектами деятельности:
Для реализации поставленной задачи необходимо реализовать:
Построение базы данных и хранилища данных осуществляется с помощью Microsoft SQL Server 2008 R2. Редактирование базы данных и хранилища данных производится с помощью Microsoft Visual Studio 2012. OLAP-кубы строятся с помощью среды SQL Server Business Intelligence Development Studio – пакет Analysis Services.
Концептуальная модель хранилища данных представляет собой описание главных (основных) сущностей и отношений между ними. Концептуальная модель является отражением предметных областей, в рамках которых планируется построение хранилища данных.
Концептуальная модель взаимосвязей представлена на рисунке 2.1.
Рисунок 2.1 – Концептуальная модель
Физическая модель данных описывает реализацию объектов логической модели на уровне объектов конкретной базы данных.
В физическом моделировании отображены основные связи данных таблиц, в которых будут записываться атрибуты. Из этого следует что, денежные значения будут записываться в тип данных DECIMAL, целые значения – INTEGER, текстовые данные будут записываться в VARCHAR().
На рисунке 2.2 представлена физическая модель базы данных.
Рисунок 2.2 – Физическая модель
Хранилище данных разрабатывается на основе таблицы фактов и таблиц измерения.
При проектировании хранилищ данных необходимо выполнять следующие требования: хранилище должно иметь понятную для пользователей структуру данных; должны быть выделены статические данные; должны быть упрощены требования к запросам для исключения запросов, требующих множественных утверждений SQL в традиционных реляционных СУБД; должна обеспечиваться поддержка сложных запросов SQL, требующих обработки миллионов записей.
Таблица фактов является основной таблицей хранилища данных. Как правило, она содержит числовые поля об объектах или событиях, совокупность которых будет в дальнейшем анализироваться. Таблицы измерений содержат неизменяемые либо редко изменяемые данные. В них находятся так называемые условия анализа данных таблицы фактов. Каждая таблица измерений должна находиться в отношении «один ко многим» с таблицей фактов. Структура хранилища данных представлена на рисунке 2.3.
Рисунок 2.3 – Структура хранилища данных
При проектирование хранилища данных использована схема «Звезда». Схема "звезда" обычно содержит одну большую таблицу, называемую таблицей факта, помещенную в центре. Ее окружают меньшие таблицы, называемые таблицами размерности, которые связаны с таблицей факта радиальными связями. Хранилище данных данного проекта состоит из одной таблицы фактов и 4 таблиц измерений.
Analysis Services предоставляет инструменты для анализа данных, которые находятся в хранилищах и киосках данных, где итоговая информация содержится в таблицах фактов. Analysis Services организует данные из хранилища в кубические массивы с помощью предварительно вычисленных агрегированных данных. Analysis Services также облегчает создание моделей извлечения информации для данных как из многомерных, так и из реляционных источников. Можно применять модели извлечения информации к обоим типам данных. Посредством службы PtvotTable - компонента доступа, совместимого с OLE DB, Microsoft Excel и приложения других производителей могут получать данные с сервера и представлять их пользователю или создавать локальные кубические массивы для автономного анализа. [5].
Для анализа данных находящихся в хранилище данных необходимо их представить в виде куба. На начальном этапе необходимо подключить хранилище данных к проекту SQL Server Business Intelligence Development Studio. Вторым этапом является создание представления источника данных (рисунок 2.4). В нем указывается набор таблиц измерений и таблица фактов. Таблица фактов — центральная таблица в схеме хранилища данных, в ней хранятся численные меры и ключи, связывающие факты с таблицами измерений.
Рисунок 2.4 – Представление источника данных
На следующем шаге необходимо создать измерения, необходимые для построении куба (рисунок 2.5).
Рисунок 2.5 – Измерения
Куб, отображающий динамику прибыли каждого отдела от времени, показан на рисунке 2.6.
Рисунок 2.6 – Динамика прибыли каждого отдела от времени
Куб, отображающий динамику активности сотрудников, показан на рисунке 2.7.
Рисунок 2.7 – Динамика активности сотрудников от времени
Для подключения к базе данных, а также к хранилищу данных, использовалась технология ADO.NET.
ADO.NET – это часть Microsoft .NET Framework, т.е. набор средств и слоев, позволяющих приложению легко управлять и взаимодействовать со своим файловым или серверным хранилищем данных [8].
ADO (ActiveX Data Objects) — это библиотека компонентов СОМ, получившая в последние несколько лет множество воплощений. ADO состоит, прежде всего, из объектов Connection, Command, Recordset и Field. С помощью ADO открывается соединение с базой данных, после чего некоторые данные извлекаются и помещаются в набор записей, состоящих из полей; эти данные затем претерпевают манипуляции и обновления на сервере, после чего соединение закрывается. Кроме того, ADO предлагает так называемый отключенный набор записей (disconnected record set), который используется, когда соединение с базой нежелательно удерживать открытым в течение длительного времени.
Как и любая другая технология, ADO.NET состоит из нескольких важных компонентов. Все классы .NET группируются в пространства имен. Кроме того, как и любые другие компоненты.NET, ADO.NET работает, не изолировано и может взаимодействовать с различными другими компонентами .NET [9].
Разработанное приложение имеет следующие функциональные возможности:
При запуске появляется окно выбора действия для приложения, изображённое на рисунке 2.8.
Рисунок 2.8 – Окно выбора действия
После выбора требуемой операции появляется главное окно приложения, изображённое на рисунке 2.9.
Рисунок 2.9 – Главное окно приложения
Изначально, после запуска приложения,
возможность редактирования данных отключена.
Для того, чтобы можно было добавлять данные,
необходимо начать ввод данных в верхней
части главного окна, затем нажать на кнопку
«Добавить» в правой панели верхней части
главного окна. Если нажать на кнопку «Добавить»
в главном окне, то появится новая запись
с внесёнными данными (рисунок 2.10).
Рисунок 2.10 – Добавление записи
Вкладка отделы отображает всю информацию по отделам фирмы (рисунок 2.11).
Рисунок 2.11– Вкладка «Отделы»
Далее следует вкладка «Языки программирования», которая отображает все языки программирования фирмы по разработке программного обеспечения (рисунок 2.12).
Рисунок 2.12 – Вкладка «Языки программирования»
Вкладка «Сотрудники» отображает информацию по сотрудникам фирмы (рисунок 2.13).
Рисунок 2.13 – Вкладка «Сотрудники»
Вкладка
«Таблица фактов» отображает информацию,
которая хранится в таблице фактов хранилища
данных (рисунок 2.14).
Рисунок 2.14 – Вкладка «Таблица фактов»
Вкладка «Измерение Дата» отображена на рисунке 2.15.
Рисунок 2.15 – Вкладка «Измерение Дата»
Далее следует вкладка «Измерение отдел»
(рисунок 2.16).
Рисунок 2.16 – Вкладка «Измерение отдел»
Следующая вкладка «Измерение язык программирования», которая отображает все используемые языки для программирования на фирме (рисунок 2.17).
Рисунок 2.17 – Вкладка «Измерение язык программирования»
Далее вкладка «Измерение сотрудники»,
отображающая список сотрудников фирмы
их имена, адреса и телефоны (рисунок 2.18).
Рисунок 2.18 – Вкладка «Измерение сотрудники»
Для более удобного рассмотрения анализируемых данных OLAP-кубы импортируем в Microsoft Office Excel. Результаты представлены на рисунках 2.19 и 2.20.
Рисунок 2.19 – Динамика прибыли
фирмы от времени
Рисунок 2.20 – Динамика активности сотрудников от времени
Людям, работающим в современных компаниях, необходимы средства оперативного анализа текущей ситуации. Одной из наиболее популярных платформ многомерного анализа является Microsoft SQL Server 2008 R2 Analysis Services. С ее помощью можно построить полноценные аналитические решения корпоративного класса, доступ к которым осуществляется через обычные офисные приложения.
Результатом выполнения курсового проекта является приложение для учета заказов на разработку программного обеспечения.
В ходе выполнения курсового проекта была создана база и хранилище данных, и разработано приложение, осуществляющее работу с ними. Разработанное приложение обладает следующей функциональностью:
Программа обеспечивает как просмотр данных о заказах, клиентах, разработчиках, целевых операционных системах и средах разработки приложений, так и редактирование.
Разработанное приложение системы управления базой знаний имеет интуитивно понятный графический интерфейс, позволяющий даже с минимальным знанием компьютера провести автоматизацию учета заказов.
Таким образом, можно сделать вывод, что цели и задачи курсового проекта выполнены в полном объеме.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
Информация о работе Хранилище данных "Прокат автотранспорта"