Бази даних та сховища даних

Автор: Пользователь скрыл имя, 06 Февраля 2013 в 13:48, творческая работа

Краткое описание

Сховище даних — предметно орієнтований, інтегрований, незмінний набір даних, що підтримує хронологію і здатний бути комплексним джерелом достовірної інформації для оперативного аналізу та прийняття рішень. В основі концепції сховища даних (СД) лежить розподіл інформації, що використовують в системах оперативної обробки даних (OLTP) і в системах підтримки прийняття рішень (СППР). Такий розподіл дозволяє оптимізувати як структури даних оперативного зберігання для виконання операцій введення, модифікації, знищення та пошуку, так і структури даних, що використовуються для аналізу. В СППР ці два типи даних називаються відповідно оперативними джерелами даних (ОДД) та сховищем даних.

Файлы: 1 файл

индивид. по исвэд.doc

— 350.00 Кб (Скачать)

Необхідність наявності  багаторівневих довідників метаданих — для систем аналізу наявність розвинутих метаданих (даних про дані) і засобів їх представлення кінцевим користувачам є однією з основних умов успішної реалізації СД. Метадані необхідні користувачам СППР для розуміння структури інформації, на основі якої приймається рішення. При створенні СД необхідно вирішувати задачі зберігання та зручного представлення метаданих користувачам.

Підвищені вимоги до безпеки  даних — зібрана разом і узгоджена інформація про історію розвитку корпорації, її успіхи та невдачі, про взаємовідносини з постачальниками та замовниками, про історію та стан ринку дає можливість аналізу минулої та поточної діяльності корпорації та побудови прогнозів для майбутнього. Очевидно, що така інформація є конфіденційною і доступ до неї обмежений в межах самої компанії, не говорячи вже про інші компанії. Для забезпечення безпеки даних потрібно вирішувати питанняавтентифікації користувачів, захисту даних при їх переміщенні в сховище даних з оперативних баз даних та зовнішніх джерел, захисту даних при їх передаванні по мережі.

Зниження затрат на створення  СД можна досягти, створюючи його спрощений варіант — вітрину даних

 

 

 

5. Області застосування баз даних

 

         Історично системи управління базами даних орієнтувалися на вирішення завдань, пов'язаних у першу чергу з транзакційною обробкою структурованої інформації. Безумовно, найкращим, перевіреним часом рішенням тут була і залишається реляційна модель СУБД. Однак в останні роки область застосування баз даних незмінно розширювалася. З одного боку, потрібно керувати більш широким набором форматів даних, переходячи до вирішення спільних проблем управління корпоративною інформацією. З іншого - саме СУБД беруть на себе основні функції інтеграції даних і додатків корпоративних систем. (За даними Gartner Group, інформаційні відділи підприємств витрачають до 40% свого бюджету на вирішення завдань інтеграції діючих компонентів баз даних.) Саме цим пояснюється активний інтерес до обговорення архітектурних принципів і можливостей реалізації баз даних різних моделей - постреляційних, об'єктно-реляційних, XML.

       Якщо постаратися класифікувати існуючі області застосування баз даних, а так само оцінити перспективи їхнього розвитку в даний час, то можна отримати приблизний список найбільш поширених класів:

  • документографічні й документальні застосовуються у всіх базах органів влади та управління;
  • бази даних з промислової, будівельної та сільськогосподарської продукції;
  • бази даних з економічної та кон'юнктурної інформації (статистична, кредитно-фінансова, зовнішньоторговельна);
  • фактографічні бази соціальних даних, які включають відомості про населення і про соціальні середовища;
  • бази даних транспортних систем;
  • довідкові дані для населення та установ (енциклопедії та довідники, розклади літаків і поїздів, адреси та телефони громадян і організацій);
  • ресурсні бази даних, що включають фактографічну інформацію про природні ресурси (земля, вода, надра, біоресурси, гідрометеорологія, вторинні ресурси і відходи, екологічна обстановка);
  • фактографічні бази і банки наукових даних, щоб забезпечити фундаментальні наукові дослідження;
  • фактографічні бази даних у галузі культури і мистецтва;
  • лінгвістичні бази даних, тобто машинні словники різного типу і призначення.

        Останнім часом утворилися нові важливі області застосування баз даних, і кожна з них представляє принципово нове середовище, до якого необхідно адаптувати технології СУБД. Ці області отримали на ринку назви інтелектуально аналізу даних (data mining), сховищ даних (data warehousing), репозитаріїв даних (data repository).

 Інтелектуальний аналіз  даних. Ідея інтелектуально аналізу даних (data mining), тобто добування інформації з величезних масивів даних, накопичених зовсім для інших цілей, викликає сьогодні підвищений ентузіазм. Наприклад, авіакомпанії домагаються оптимального заповнення рейсів за рахунок аналізу накопичених раніше даних про резервування квитків. Можна навести одну історію про те, як була виявлена несподівана кореляція між покупками пива і покупками серветок у післяобідній період. Власник магазину наблизив один до одного відділи, які торгують пивом і серветками, а між ними помістив ще прилавки з картопляними чіпсами. У результаті збільшилися продажі усіх трьох видів товару.

 Із запитами, характерними для систем інтелектуально аналізу даних, пов'язана низка незвичайних проблем. Вони включають, як правило, агрегацію величезних обсягів даних. Вони мають нерегламентований характер; їх формулюють особи, відповідальні за прийняття рішень, коли їм необхідно виявити будь-які неочевидні взаємозв'язки.

У додатках, пов'язаних, наприклад, з торгівлею цінними паперами, дуже важливий малий час відповіді. Суть проблеми полягає тут у тому, щоб скоротити загальний час, необхідний для написання, налагодження та виконання запиту. Досить часто користувач не в змозі точно сформулювати запит - йому просто потрібно виявити "що-небудь цікаве".

Таким чином, з видобутком даних пов'язані такі дослідницькі напрями:

  • методи оптимізації складних запитів, які включають, наприклад, агрегацію та групування;
  • методи підтримки "багатовимірних" запитів, що відносяться до даних, організованих у вигляді "куба", в осередках якого знаходяться потрібні дані;
  • методи оптимізації використання третинної пам'яті;
  • мови запитів дуже високого рівня, а також інтерфейси для підтримки користувачів, які не є експертами, і яким потрібні відповіді на нерегламентовані запити.

 

 

 

Висновки

 

База даних – сукупність екземплярів різних типів записів і відношень між записами та елементами.

Базу даних можна визначити як сукупність взаємозв'язаних даних (прості чи складені типи), що зберігаються разом на одному носії та описують якусь предметну область за наявності такої мінімальної надмірності, яка допускає їх використання оптимальним чином для одного або декількох застосувань. Розрізняють ієрархічні, мережеві, реляційні, часові (темпоральні), постреляційні (об’єктно-орієнтовані, з гніздуванням), розподілені та багатовимірні бази даних.

Використання бази даних  припускає роботу з нею декількох  прикладних програм (застосувань), що вирішують завдання різних користувачів.

Сховище даних – це аґреґований інформаційний ресурс, що містить консолідовану інформацію з усієї проблемної області та використовується для підтримки прийняття рішень.

Консолідована інформація – це одержані з декількох джерел та системно інтеґровані різнотипні інформаційні ресурси, які в сукупності наділені ознаками повноти, цілісності, несуперечності та складають адекватну інформаційну модель проблемної області з метою її аналізу опрацювання та ефективного використання в процесах підтримки прийняття рішень.

Типове сховище даних  зазвичай відрізняється від традиційної  реляційної бази даних. По-перше, традиційні бази даних призначені для того, щоб допомогти користувачам виконувати повсякденну роботу, тоді як сховища даних призначені для прийняття рішень. Наприклад, продаж товару і виписування рахунку здійснюється з використанням бази даних, призначеної для опрацювання транзакцій, а аналіз динаміки продажів за декілька років, що дозволяє спланувати роботу з постачальниками, — за допомогою сховища даних.

По-друге, традиційні бази даних характеризуються постійними змінами у процесі роботи користувачів, а сховище даних відносно стабільне: дані у ньому зазвичай оновлюються  за розкладом (наприклад, щотижня, щодня або щогодини — залежно від потреб). В ідеалі процес 
поповнення (або як далі ми будемо називати завантаження) є просто додаванням нових даних за певний період часу без зміни попередньої інформації, що вже міститься в сховищі.

І, по-третє, традиційні бази даних найчастіше є джерелом даних, що потрапляють у сховище. Крім того, сховище може поповнюватися за рахунок зовнішніх джерел, наприклад статистичних звітів. Дані, що надходять до бази даних з іншої бази, є невеликого обсягу (тисячі записів), мають ту ж схему даних, що і база даних-приймач. На відміну від них сховища даних у визначені терміни отримують значно більші обсяги даних, які можуть відріхнятися від приймача форматом, а інколи і типом, що вимагає застосування додаткових процедур трансформування та завантаження даних (так звані процедури Extract, Transform, Load).

Як бази даних, так  і сховища даних, можуть будуватись на основі певної системи керування  базами даних (СКБД) (реляційна, постреляційна  тощо). СКБД забезпечує загальний репозиторій для зберігання і опрацювання структурованих даних. СКБД підтримує набір взаємозв'язаних послуг і дозволяє розробникам зосередитись на специфічних проблемах їх застосувань, а не на завданнях, які виникають при потребі в узгодженому й ефективному керуванні великими обсягами даних. Проте СКБД вимагають, щоб всі дані знаходилися під єдиним адміністративним керуванням і відповідали єдиній схемі. У відповідь на задоволення цих обмежень СКБД можуть забезпечити розвинені засоби маніпулювання даними та опрацювання запитів зі зрозумілою і строгою семантикою, а також строгі транзакційні ґарантії оновлень, паралельного доступу і довготривалого зберігання (так звані властивості ACID).

 

Список використаних джерел

 

    1. Журнал з інформаційних систем [Електронний ресурс].- Режим доступу: http://sit.fizmat.tnpu.edu.ua›geogr_turizm/teor/
    2. Розробка схем баз даних  [Електронний ресурс].- Режим доступу: http:// lib.mdpu.org.ua›e-book/vstup/L5.htm
    3. Стаття «Сховища даних» [Електронний ресурс].- Режим доступу: http:/ email.court.gov.ua
    4. Офіційний сайт бібліотеки м. Тереза [Електронний ресурс].- Режим доступу: http:/ naiau.kiev.ua›biblio/books/inform_OVS
    5. Інформаційні системи  [Електронний ресурс].- Режим доступу: http:/ archives.gov.ua›Db/

Информация о работе Бази даних та сховища даних