Відмінності між версіями «Сховище даних, OLAP - куб»
Рядок 24: | Рядок 24: | ||
*[http://uk.wikipedia.org/wiki/Data_mining Data Mining] | *[http://uk.wikipedia.org/wiki/Data_mining Data Mining] | ||
*[http://uk.wikipedia.org/wiki/Business_intelligence BI] | *[http://uk.wikipedia.org/wiki/Business_intelligence BI] | ||
− | == Джерела | + | == Джерела == |
Версія за 02:02, 12 лютого 2012
Сховище даних (data warehouse) - предметно-орієнтований, інтегрований, незмінний, що підтримує хронологію, набір даних, організований для цілей підтримки прийняття рішень. Основна мета створення data warehouse в тому, щоб зробити усі значимі для управління бізнесом дані доступними в стандартизованій формі, придатними для аналізу та отримання необхідних звітів. Для досягнення цього потрібно отримати дані із існуючих внутрішніх та зовнішніх, доступних для комп'ютера, джерел.
Зміст
Концепція СД
Предметно - орієнтованість
Предметна орієнтованість є фундаментальною відмінністю сховища даних від ОБД. Різні ОБД можуть зберігати дані, які описують одну і ту саму предметну область з різних точок зору (наприклад, з точки зору бухгалтерського обліку, відділу планування і т.д.). Рішення прийняте на основі тільки однієї точки зору, може бути неефективним або навіть хибним. Сховище даних дозволяють інтегрувати інформацію, яка представляє різні точки зору на одну предметну область. Предметна орієнтація дозволяє також зберігати в СД тільки ті дані, які потрібні для аналізу(наприклад, для аналізу немає необхідності зберігати інформацію про номери документів купівлі - продажу, в той час як кількість і ціна проданого товару необхідно).
Інтегрованість
ОБД які використовуються на підприємствах, як правило, розробляються в різний час декількома колективами з власними інструментами. Це призводить до того, що дані які представляють один і той же об'єкт реального світу знаходяться в різних системах, описують його по різному. Обов'язкова інтеграція даних в сховищі даних, дозволяє вирішити цю проблему, приводячи дані до єдиного формату.
Підтримка хронології
Дані в ОБД необхідні для виконання над ними операцій в поточний момент часу. Тому вони можуть не мати прив'язки до часу. Для аналізу даних часто важливо мати можливість відстежувати хронологію зміни показників предметної області. Тому всі дані, які зберігаються в СД, повинні відповідати послідовним інтервалам часу.
Незмінність
Вимоги до БД накладають обмеження на час збереження даних в них. Ті дані які непотрібні для оперативної обробки даних, як правило, видаляються з БД для зменшення зайнятих ресурсів. Для аналізу, навпаки, необхідно мати інформацію за максимально більший період часу. Тому, на відмінно від БД, дані в сховищі даних після завантаження тільки читаються. Це дозволяє суттєво підвищити скорість доступу до даних, як за рахунок можливої надлишковості даних, так і за рахунок виключення операцій модифікації.
Поняття OLAP - куба
OLAP – абревіатура від англійського On-Line Analytical Processing – це назва не конкретного продукту, не мови програмування і навіть не конкретна технологія. Якщо постаратись охватити OLAP в всіх його проявах, то це сукупність концепцій, принципів і вимог, які лежать в основі програмних продуктів, полегшують аналітикам доступ до даних.