Автор: Пользователь скрыл имя, 06 Февраля 2013 в 13:48, творческая работа
Сховище даних — предметно орієнтований, інтегрований, незмінний набір даних, що підтримує хронологію і здатний бути комплексним джерелом достовірної інформації для оперативного аналізу та прийняття рішень. В основі концепції сховища даних (СД) лежить розподіл інформації, що використовують в системах оперативної обробки даних (OLTP) і в системах підтримки прийняття рішень (СППР). Такий розподіл дозволяє оптимізувати як структури даних оперативного зберігання для виконання операцій введення, модифікації, знищення та пошуку, так і структури даних, що використовуються для аналізу. В СППР ці два типи даних називаються відповідно оперативними джерелами даних (ОДД) та сховищем даних.
Необхідність наявності багаторівневих довідників метаданих — для систем аналізу наявність розвинутих метаданих (даних про дані) і засобів їх представлення кінцевим користувачам є однією з основних умов успішної реалізації СД. Метадані необхідні користувачам СППР для розуміння структури інформації, на основі якої приймається рішення. При створенні СД необхідно вирішувати задачі зберігання та зручного представлення метаданих користувачам.
Підвищені вимоги до безпеки
даних — зібрана разом і узгоджена інформація
про історію розвитку корпорації, її успіхи
та невдачі, про взаємовідносини з постачальниками
та замовниками, про історію та стан ринку
дає можливість аналізу минулої та поточної
діяльності корпорації та побудови прогнозів
для майбутнього. Очевидно, що така інформація
є конфіденційною і доступ до неї обмежений
в межах самої компанії, не говорячи вже
про інші компанії. Для забезпечення безпеки
даних потрібно вирішувати питанняавтентифікації користув
Зниження затрат на створення СД можна досягти, створюючи його спрощений варіант — вітрину даних
5. Області застосування баз даних
Історично системи управління базами даних орієнтувалися на вирішення завдань, пов'язаних у першу чергу з транзакційною обробкою структурованої інформації. Безумовно, найкращим, перевіреним часом рішенням тут була і залишається реляційна модель СУБД. Однак в останні роки область застосування баз даних незмінно розширювалася. З одного боку, потрібно керувати більш широким набором форматів даних, переходячи до вирішення спільних проблем управління корпоративною інформацією. З іншого - саме СУБД беруть на себе основні функції інтеграції даних і додатків корпоративних систем. (За даними Gartner Group, інформаційні відділи підприємств витрачають до 40% свого бюджету на вирішення завдань інтеграції діючих компонентів баз даних.) Саме цим пояснюється активний інтерес до обговорення архітектурних принципів і можливостей реалізації баз даних різних моделей - постреляційних, об'єктно-реляційних, XML.
Якщо постаратися класифікувати існуючі області застосування баз даних, а так само оцінити перспективи їхнього розвитку в даний час, то можна отримати приблизний список найбільш поширених класів:
Останнім часом утворилися нові важливі області застосування баз даних, і кожна з них представляє принципово нове середовище, до якого необхідно адаптувати технології СУБД. Ці області отримали на ринку назви інтелектуально аналізу даних (data mining), сховищ даних (data warehousing), репозитаріїв даних (data repository).
Інтелектуальний аналіз даних. Ідея інтелектуально аналізу даних (data mining), тобто добування інформації з величезних масивів даних, накопичених зовсім для інших цілей, викликає сьогодні підвищений ентузіазм. Наприклад, авіакомпанії домагаються оптимального заповнення рейсів за рахунок аналізу накопичених раніше даних про резервування квитків. Можна навести одну історію про те, як була виявлена несподівана кореляція між покупками пива і покупками серветок у післяобідній період. Власник магазину наблизив один до одного відділи, які торгують пивом і серветками, а між ними помістив ще прилавки з картопляними чіпсами. У результаті збільшилися продажі усіх трьох видів товару.
Із запитами, характерними для систем інтелектуально аналізу даних, пов'язана низка незвичайних проблем. Вони включають, як правило, агрегацію величезних обсягів даних. Вони мають нерегламентований характер; їх формулюють особи, відповідальні за прийняття рішень, коли їм необхідно виявити будь-які неочевидні взаємозв'язки.
У додатках, пов'язаних, наприклад, з торгівлею цінними паперами, дуже важливий малий час відповіді. Суть проблеми полягає тут у тому, щоб скоротити загальний час, необхідний для написання, налагодження та виконання запиту. Досить часто користувач не в змозі точно сформулювати запит - йому просто потрібно виявити "що-небудь цікаве".
Таким чином, з видобутком даних пов'язані такі дослідницькі напрями:
Висновки
База даних – сукупність екземплярів різних типів записів і відношень між записами та елементами.
Базу даних можна визначити як сукупність взаємозв'язаних даних (прості чи складені типи), що зберігаються разом на одному носії та описують якусь предметну область за наявності такої мінімальної надмірності, яка допускає їх використання оптимальним чином для одного або декількох застосувань. Розрізняють ієрархічні, мережеві, реляційні, часові (темпоральні), постреляційні (об’єктно-орієнтовані, з гніздуванням), розподілені та багатовимірні бази даних.
Використання бази даних припускає роботу з нею декількох прикладних програм (застосувань), що вирішують завдання різних користувачів.
Сховище даних – це аґреґований інформаційний ресурс, що містить консолідовану інформацію з усієї проблемної області та використовується для підтримки прийняття рішень.
Консолідована інформація – це одержані з декількох джерел та системно інтеґровані різнотипні інформаційні ресурси, які в сукупності наділені ознаками повноти, цілісності, несуперечності та складають адекватну інформаційну модель проблемної області з метою її аналізу опрацювання та ефективного використання в процесах підтримки прийняття рішень.
Типове сховище даних зазвичай відрізняється від традиційної реляційної бази даних. По-перше, традиційні бази даних призначені для того, щоб допомогти користувачам виконувати повсякденну роботу, тоді як сховища даних призначені для прийняття рішень. Наприклад, продаж товару і виписування рахунку здійснюється з використанням бази даних, призначеної для опрацювання транзакцій, а аналіз динаміки продажів за декілька років, що дозволяє спланувати роботу з постачальниками, — за допомогою сховища даних.
По-друге, традиційні бази
даних характеризуються постійними
змінами у процесі роботи користувачів,
а сховище даних відносно стабільне:
дані у ньому зазвичай оновлюються
за розкладом (наприклад, щотижня, щодня або щогодини — залежно
від потреб). В ідеалі процес
поповнення (або як далі ми будемо називати завантаження)
є просто додаванням нових даних за певний
період часу без зміни попередньої інформації,
що вже міститься в сховищі.
І, по-третє, традиційні бази даних найчастіше є джерелом даних, що потрапляють у сховище. Крім того, сховище може поповнюватися за рахунок зовнішніх джерел, наприклад статистичних звітів. Дані, що надходять до бази даних з іншої бази, є невеликого обсягу (тисячі записів), мають ту ж схему даних, що і база даних-приймач. На відміну від них сховища даних у визначені терміни отримують значно більші обсяги даних, які можуть відріхнятися від приймача форматом, а інколи і типом, що вимагає застосування додаткових процедур трансформування та завантаження даних (так звані процедури Extract, Transform, Load).
Як бази даних, так і сховища даних, можуть будуватись на основі певної системи керування базами даних (СКБД) (реляційна, постреляційна тощо). СКБД забезпечує загальний репозиторій для зберігання і опрацювання структурованих даних. СКБД підтримує набір взаємозв'язаних послуг і дозволяє розробникам зосередитись на специфічних проблемах їх застосувань, а не на завданнях, які виникають при потребі в узгодженому й ефективному керуванні великими обсягами даних. Проте СКБД вимагають, щоб всі дані знаходилися під єдиним адміністративним керуванням і відповідали єдиній схемі. У відповідь на задоволення цих обмежень СКБД можуть забезпечити розвинені засоби маніпулювання даними та опрацювання запитів зі зрозумілою і строгою семантикою, а також строгі транзакційні ґарантії оновлень, паралельного доступу і довготривалого зберігання (так звані властивості ACID).
Список використаних джерел