1/26
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai |
|---|
No study sessions yet.
business intelligence
Zbiór koncepcji i metod wspomagających podejmowanie decyzji używających systemów wspomagania, które bazują na faktach.
business analytics
Wszelkiego rodzaju narzędzia i aplikacje analityczne służące do szeroko rozumianego zarządzania wydajnością przedsiębiorstwa. Dzielą się na 2 kategorie:
narzędzia i aplikacje do zarządzania wydajnością
platformy hurtowni danych
Kategoria aplikacji do zarządzania wydajnością
Uniwersalne narzędzia analityczne (BI)
Narzędzia służące do analizy danych przestrzennych zapisanych w bazach danych systemów informacji przestrzennej
Aplikacje analityczne przeznaczone dla konkretnych obszarów
agregacje OLAP
narzędzia przygotowania i specjalne struktury wielowymiarowe dla danych zagregowanych
obszary zastosowań systemów Business Intelligence
CRM
Finanse i Controlling
Sprzedaż
Marketing
Produkcja
Logistyka
Kadry i płace
4 perspektywy biznesu ( Balanse Scorecard)
Finansowa
Klienta
Procesów gospodarczych
Rozwoju i wzrostu
Ocena jakości hurtowni danych jest zwykle dokonywana w 5 perspektywach:
Dane
Czas
Działanie
Projekt
Narzędzia
Ocena - dane
dokładność - zgodność z rzeczywistością
kompletność - wartości niepuste
spójność - w zakresie przyjętego formatu danych
weryfikowalność - możliwość sprawdzenia wierszy
Ocena - czas
aktualność - dane zgodne w danym czasie
ulotność - spełnianie wymagań czasowych
dostarczanie danych na czas - we właściwym czasie
ekstrakcja
dostęp do systemów źródłowych i kopiowanie tylko wymaganych danych
przeniesienie do obszaru przejściowego (bazy operacyjnej)
najczęściej wykorzystuje zapytania SQL
Źródła danych w procesie ekstrakcji
bazy danych systemów transakcyjnych
dane archiwalne
pliki tekstowe, arkusze kalkulacyjne, pliki baz danych
hurtownie danych
inne
transformacja
w bazie operacyjnej:
zamiana na jednolity format
poprawianie literówek
rozwiązywanie konfliktów w danych
rozwiązywanie problemów brakujących danych
usuwanie duplikatów danych
łączenie wielu zbiorów danych
utrzymanie integralności danych
ładowanie
Dane są ładowane z bazy operacyjnej do repozytorium hurtowni danych. Metody:
jednostkowe przenoszenie danych
zewnętrzne przekształcanie i przenoszenie całych zbiorów danych
ładowanie binarne z zastosowanie silnika hurtowni
podejście sterowane danymi (data-driven approach)
Modelowanie danych w hurtowni rozpoczyna się od analizy transakcyjnych źródeł danych w celu pozyskania logicznych schematów danych.
systemy klas ERP CRM →(analiza danych)→logiczne schematy danych
podejście sterowane celami (goal-driven approach)
Dopasowanie hurtowni danych do strategii oraz wymagań biznesowych korporacji, w której następuje wdrożenie.
strategia i wymagania biznesowe organizacji →(analiza strategii)→projekt hurtowni danych
podejście sterowane przez użytkowników (user-driven approach)
Celem jest dotarcie do przyszłych użytkowników hurtowni danych i dokonanie analizy ich wymagań odnośnie funkcjonalności hurtowni danych.
Użytkownicy hurtowni danych →(analiza wymagań)→funkcjonalność hurtowni danych
modele hurtowni daych
model konceptualny
model logiczny
model fizyczny
model konceptualny
określa wymagania informacyjne dla hurtowni danych
utworzenie schematu konceptualnego powinno zostać poprzedzone analizą wymagań przyszłych użytkowników projektowanej hurtowni danych
Retrospekcja
Umożliwia klasyfikację składników modelu konceptualnego. Może być:
prawdziwa - obiekt wiernie odwzorowuje przeszłość
fałszywa - oznacza, że wraz ze zmianami wartości obiektu będzie zmieniany również obraz jego historii
trwała - powoduje, że wartość obiektu nie podlega zmianom w czasie
model konceptualny - model punktowy (dot modeling)
dostarcza ustrukturyzowanego sposobu konstruowania modelu logicznego na podstawie modelu pojęciowego
występują 3 składniki:
punkt - reprezentujący fakty, do których stosowana jest nazwa obszaru tematycznego w modelu wymiarowym
nazwy wymiarów - odzwierciedlające wymiary hurtowni
łączniki - umieszczane między faktami a wymiarami, lub wymiarami a grupowaniami w celu pokazania wymiarów lub hierarchicznej struktury hurtowni
modelowanie logiczne
badanie możliwości oraz rozwiązań implementacyjnych ogólnego modelu pojęciowego w hurtowniach danych
badana jest przede wszystkim możliwość realizacji koncepcji retrospekcji z modelu pojęciowego
model fizyczny
odzwierciedla strukturę fizyczną bazy danych
definiuje strukturę zgodną z właściwościami słownika danych bazy
jest zbiorem definicji tabel, perspektyw oraz innych składników bazy danych
Wolno zmieniające się wymiary SCD Slowly Changing Dimensions
Pozwalają zarządzać zmianami metodologicznymi lub innymi, pojawiającymi się w szeregu czasowym. Dotyczy pojęć zawartych w tabelach wymiarów. Najczęściej występujące typy:
typ 1 - nadpisanie wartości atrybutu
typ 2 - dodanie nowego wiersza wymiaru
typ 3 - dodanie nowego atrybutu wymiaru
SCD - typ 1
oznacza, że poprzednia wartość atrybutu zostanie nadpisana przez jej nową wartość.
tym samym historyczna wartość jest bezpowrotnie tracona
jest to jedno z niewskazanych rozwiązań, gdyż może prowadzić do zaburzeń szeregów czasowych jeżeli metodologia dotycząca pojęcia ulega zmianie
SCD - typ 2
najpowszechniej wykorzystywana metoda zarządzania regułami dotyczącymi wolno zmieniających się wymiarów
w ramach tej metody powstaje nowy atrybut z własnym kluczem głównym, a wszelkie poprzednie wartości zbliżone metodologicznie do nowego atrybutu zostają zachowane z niezmienionym kluczem głównym w bazie danych
SCD - typ 3
jest jednym z rozwiązań pozwalających na przechowywanie poprzedniej i bieżącej definicji atrybutu (np. zmienionego obszaru województwa) w jednym miejscu
tym samym użytkownik będzie śledził szereg czasowy posługując się dwiema definicjami dla pojedynczego wiersza
retrospekcja a SCD
prawdziwa - obiekt będzie wiernie odwzorowywał przeszłość
fałszywa - wraz ze zmianami wartości obiektu będzie zmieniany również obraz jego historii
trwała - oznacza, że wartość obiektu nie podlega zmianom w czasie